摘要: 本文测试的Spark版本是1.3.1本文将在Spark集群上搭建一个简单的小型的电影推荐系统,以为之后的完整项目做铺垫和知识积累整个系统的工作流程描述如下: 1.某电影网站拥有可观的电影资源和用户数,通过各个用户对各个电影的评分,汇总得到了海量的用户-电影-评分数据 2.我在一个电... 阅读全文
posted @ 2015-05-27 20:46 蒋源德 阅读(586) 评论(0) 推荐(0) 编辑
摘要: 本文测试的Spark版本是1.3.1在使用Spark的机器学习算法库之前,需要先了解Mllib中几个基础的概念和专门用于机器学习的数据类型特征向量Vector:Vector的概念是和数学中的向量是一样的,通俗的看其实就是一个装着Double数据的数组 Vector分为两种,分别是密... 阅读全文
posted @ 2015-05-27 19:33 蒋源德 阅读(349) 评论(0) 推荐(0) 编辑