摘要: 恢复内容开始 三、Spark RDDS 可以把RDDs看做特殊得待处理数据集,可以并行被处理,操作这个数据集的包括两个方法,一个是转换(transformations)不计算结果,一个是active(动作),计算出结果 1、弹性分布式数据集(RDDs) spark核心的概念是RDD:一个可并行操作的 阅读全文
posted @ 2018-03-28 22:23 lxwlxw 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 1、推荐系统整体框架 2、推荐系统所用算法及所需数据 基于协同过滤的推荐 基于内容的推荐 基于内容推荐的原理: 01、如何定义内容相似度,新闻作为文本类的数据,本身可以从文本特征几个方面去提取它的特征信息,进而将不同的新闻间的特征信息进行比较 常见的特征信息有:新闻文本长度、新闻所属话题类型(社会、 阅读全文
posted @ 2018-03-28 14:55 lxwlxw 阅读(1630) 评论(0) 推荐(0) 编辑