11 2018 档案
摘要:KMeans KMeans是一种无监督学习聚类方法, 目的是发现数据中数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。 无监督学习,也就是没有对应的标签,只有数据记录.通过KMeans聚类,可以将数据划分成一个簇,进而发现数据之间的关系. 原理 KMeans算法
阅读全文
摘要:决策树 决策树是一种基本的分类和回归方法.决策树顾名思义,模型可以表示为树型结构,可以认为是if then的集合,也可以认为是定义在特征空间与类空间上的条件概率分布. [图片上传失败...(image 2e6565 1543139272117)] 决策树的中间节点可以看做是对一种特征的判断,也是符合
阅读全文
摘要:推荐系统的目的是联系用户的兴趣和物品,这种联系需要以来不同的媒介。GroupLens在一篇文章中表示目前流行的推荐系统基本上通过3种方式联系童虎兴趣和物品。 第一种方式是利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品,也就是基于物品的推荐算法。第二种方式是利用和用户兴趣相似的其他用户,给
阅读全文
摘要:推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就称为推荐系统的重要组成部分和先决条件 。很多在开始阶段就希望有个性化推荐应用的网站来说, 如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题 。 冷启动问题
阅读全文
摘要:基于用户行为分析的推荐算法是个性化推荐系统的重要算法,一般将这种类型的算法称为协同过滤算法 。协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使自己的推荐列表能够不断过滤掉自己不感兴趣的物品,从而越来越满足自己的需求。 用户行为数据简介 用户行为数据在网站上最简单的存在形式就是日志。网站在运行
阅读全文
摘要:什么是推荐系统 information overload信息过载时代: 信息爆炸。 在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:作为信息消费者,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情;作为信息生产者,如何让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困
阅读全文