随笔分类 -  读书笔记

摘要:线性代数是机器学习的数学基础之一,这里总结一下深度学习花书线性代数一章中机器学习主要用到的知识,并不囊括所有线性代数知识。 2.1 基础概念 Scalars: 一个数; Vctors: 一列数; Matrices: 二位数组的数,每个元素由两个下标确定; Tensors: 多维数组的数。 2.2 矩 阅读全文
posted @ 2018-12-01 22:29 深度机器学习 阅读(428) 评论(0) 推荐(0) 编辑
摘要:Deep Learning是大神Ian GoodFellow, Yoshua Bengio 和 Aaron Courville合著的深度学习的武功秘籍,涵盖深度学习各个领域,从基础到前沿研究。因为封面上有人工智能生成的鲜花图像,人送外号“花书” 。该书系统地介绍了深度学习的基础知识和后续发展,是一本 阅读全文
posted @ 2018-12-01 18:08 深度机器学习 阅读(1165) 评论(0) 推荐(0) 编辑
摘要:4.1 介绍 CF系统需要用户的评分数据作为知识源,向用户推荐商品,而不需要输入并维护其他的附加信息。基于内容的推荐系统主要应用的知识源包括类别和体裁信息,还有从文档中提取的关键词。这两种方法的优势在于能以相对较小的代价获取并维护这些知识。但是日常生活中,纯粹的CF系统会由于评分数据很少而效果不好, 阅读全文
posted @ 2018-11-16 23:03 深度机器学习 阅读(2428) 评论(0) 推荐(0) 编辑
摘要:在应用协同过滤推荐技术时,除了用户评分数据,我们不需要额外的物品数据。这样的好处是避免了付出很大的代价向系统提供详细而且实时更新的物品描述信息,但是这种仅基于纯粹的协同过滤的算法却无法根据物品的特性和用户的特殊偏好来客观选择推荐物品的。 本章中,将物品的特征描述为“内容”。因为后面章节部分介绍的大多 阅读全文
posted @ 2018-11-16 22:09 深度机器学习 阅读(1255) 评论(0) 推荐(0) 编辑
摘要:协同过滤推荐的主要思想:利用已有用户群过去的行为或意见预测当前用户最可能喜欢哪些东西或对哪些东西感兴趣。 纯粹的协同过滤方法的输入数据只有给定的用户—物品评分矩阵,输出数据一般有以下几种类型: 2.1 基于用户的最近邻推荐 它的主要思想:首先,给定一个评分数据集和当前用户的id作为输入,找出与当前用 阅读全文
posted @ 2018-11-16 12:09 深度机器学习 阅读(682) 评论(0) 推荐(0) 编辑
摘要:在书的“后记”部分,作者列出了Strand研究人员总结的“推荐系统十堂课”,总结了他们设计推荐系统的经验和教训。 1. 确定你真的需要推荐系统 个人评价:不是为了推荐而推荐,推荐只是手段,关键看用户价值在哪里,从用户角度出发,真正能帮助用户。 2. 确定商业目标和用户满意度之间的关系 3. 选择合适 阅读全文
posted @ 2018-11-01 12:52 深度机器学习 阅读(1611) 评论(0) 推荐(0) 编辑
摘要:7.1 外围架构 7.2 推荐系统架构 基于特征的推荐系统架构 用户喜欢的物品、用户相似的用户也可以抽象成特征; 基于特征的推荐系统核心任务就被拆解成两部分,一个是如何为给定用户生成特征,另一个是如何根据特征找到物品; 用户喜欢的物品、用户相似的用户也可以抽象成特征; 基于特征的推荐系统核心任务就被 阅读全文
posted @ 2018-11-01 11:43 深度机器学习 阅读(1290) 评论(0) 推荐(0) 编辑
摘要:美国著名的第三方调查机构尼尔森调查了影响用户相信某个推荐结果的因素,90%的用户相信朋友对他们的推荐。基于社交网络的推荐可以很好的模拟现实社会。所以利用社交网络数据进行推荐可以增加用户对系统的信任度。另外利用用户在社交网络的数据可以解决冷启动问题。 6.1 获取社交网络数据的途径 主要方式: 电子邮 阅读全文
posted @ 2018-10-31 14:04 深度机器学习 阅读(1110) 评论(0) 推荐(0) 编辑
摘要:准确了解用户的上下文信息(包括时间、地点、心情等),对于提升推荐效果有重要作用。 5.1 时间上下文信息 (1)时间效应 用户的兴趣是变化的 物品也有生命周期 季节效应 (2)系统时间特性的分析 数据集每天独立用户数的增长情况 系统物品的变化情况 e.g. 物品平均在线天数 e.g. 相隔T天系统物 阅读全文
posted @ 2018-10-31 11:22 深度机器学习 阅读(960) 评论(0) 推荐(0) 编辑
摘要:标签应用:一种是让作者或专家给物品打标签;另一种是让普通用户给物品打标签(UGC)。当一个用户对一个物品打上标签,这个标签一方面描述了用户的兴趣,另一方面则表示了物品的语义,从而将用户和物品联系了起来。标签,是一种重要的特征表现方式。 4.1 UGC标签系统的代表应用 标签系统的最大优势:发挥群体智 阅读全文
posted @ 2018-10-30 12:23 深度机器学习 阅读(942) 评论(0) 推荐(0) 编辑
摘要:3.1 冷启动问题简介 问题分类: 用户冷启动 物品冷启动 系统冷启动 常用解决方案: 利用热销榜进行推荐 利用用户注册时的年龄、性别等数据做粗粒度的个性化 利用用户社交数据为其推荐好友喜欢的物品 要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息并推荐相似产品 对于新加入的物品,可以 阅读全文
posted @ 2018-10-28 11:32 深度机器学习 阅读(1197) 评论(0) 推荐(0) 编辑
摘要:2.1 用户行为数据简介 用户行为数据可分为显性反馈行为和隐性反馈行为; 用户数据的统一表示; 2.2 用户行为分析 在设计推荐算法之前需要对用户行为数据进行分析,了解数据中蕴含的一般规律可以对算法的设计起到指导作用。 用户活跃度和物品流行度 均近似符合长尾分布:e.g. 物品流行度定义:对用户产生 阅读全文
posted @ 2018-10-27 22:52 深度机器学习 阅读(1401) 评论(0) 推荐(1) 编辑
摘要:1.1 什么是推荐系统 (1)解决信息过载的三种方式: (2)推荐系统可以更好的发掘商品的长尾 传统2/8理论受到挑战。互联网条件下,由于货架成本极端低廉,电子商务网站往往能出售比传统零售店更多种类的商品。与传统零售业相比,电商的长尾商品数量极其庞大,这些长尾的总销售额甚至能超过热门商品。 推荐系统 阅读全文
posted @ 2018-10-24 21:34 深度机器学习 阅读(3259) 评论(0) 推荐(0) 编辑