Fork me on GitHub

09 2019 档案

摘要:1. 与Hive的集成 Hive和Hbase在大数据架构中处在不同位置,Hive是一个构建在Hadoop基础之上的数据仓库,主要解决分布式存储的大数据处理和计算问题,Hive提供了类SQL语句,叫HiveQL, 通过它可以使用SQL查询存放在HDFS上的数据,sql语句最终被转化为Map/Reduc 阅读全文
posted @ 2019-09-20 10:07 kris12 阅读(1571) 评论(0) 推荐(0) 编辑
摘要:3. 基于协同过滤的推荐算法 (用户和物品的关联) 协同过滤(Collaborative Filtering,CF)-- 用户和物品之间关联的用户行为数据 ①基于近邻的协同过滤 基于用户(User-CF) --用户画像 基于物品(Item-CF) -- 基于内容-特征工程 ②基于模型的协同过滤 奇异 阅读全文
posted @ 2019-09-18 11:44 kris12 阅读(4969) 评论(1) 推荐(1) 编辑
摘要:常用推荐算法分类 实时和离线; 是否个性化推荐;基于统计的推荐; 个性化推荐的原则:如可以基于相似度去划分、基于已有的知识去推荐、基于模型的推荐(去学习这个推荐的模型); 按数据源划分:用户、物品、用户行为数据即它们俩之间的关系; 基于人口统计学的推荐(基于用户)与用户画像 基于内容的推荐(基于物品 阅读全文
posted @ 2019-09-18 11:43 kris12 阅读(2218) 评论(1) 推荐(0) 编辑

levels of contents
点击右上角即可分享
微信分享提示