2017 年 7月 19 日随笔档案 - fdu_taoshiqian

2017年7月19日

Spark 2.2.0 文档中文版 Collaborative Filtering 协同过滤 JAVA推荐系统

摘要：协同过滤常用于推荐系统，这项技术旨在填补丢失的user-item关联矩阵的条目，spark.ml目前支持基于模型的协同过滤（用一些丢失条目的潜在因素在描述用户和产品）。spark.ml使用ALS（交替最小二乘法）去学习这些潜在因素。在spark.ml中的实现有以下参数： numBlocks：块的阅读全文

posted @ 2017-07-19 16:30 fdu_taoshiqian 阅读(2768) 评论(0) 推荐(0) 编辑

Spark 2.2.0 文档中文版 Spark Programming Guide 编程指南

摘要：综述：在高层中，每个spark应用由一个运行用户主函数的driver program和执行各种集群上的parallel operations所组成。spark最主要的概念：RDD弹性分布式数据集，它是一个跨越“可并行操作集群”所有节点的基本分区的集合。RDDs可被多种方式创建：hadoop文件系统阅读全文

posted @ 2017-07-19 14:53 fdu_taoshiqian 阅读(3739) 评论(2) 推荐(1) 编辑

fdu_taoshiqian

公告