摘要: 原文链接:https://www.jianshu.com/p/ba1936ee0b69 https://www.cnblogs.com/pinard/p/9128682.html 排序推荐算法大体上可以分为三类,第一类排序算法类别是点对方法(Pointwise Approach),这类算法将排序问题 阅读全文
posted @ 2019-10-08 20:07 韩雪溪 阅读(823) 评论(0) 推荐(0) 编辑
摘要: 1.ndim,shape,dtype,astype的用法 1.ndim返回的是数组的维度,返回的只有一个数,该数即表示数组的维度 2.shape:表示各位维度大小的元组。返回的是一个元组 3.dtype:一个用于说明数组数据类型的对象。返回的是该数组的数据类型 4.astype:转换数组的数据类型 阅读全文
posted @ 2019-10-06 16:18 韩雪溪 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 使用Embedding的原因: 使用One-hot 方法编码的向量会很高维也很稀疏。假设我们在做自然语言处理(NLP)中遇到了一个包含2000个词的字典,当时用One-hot编码时,每一个词会被一个包含2000个整数的向量来表示,其中1999个数字是0,要是我的字典再大一点的话这种方法的计算效率岂不 阅读全文
posted @ 2019-10-03 15:21 韩雪溪 阅读(1169) 评论(0) 推荐(0) 编辑
摘要: 逐点互信息(PIM):用来衡量两个事物的相关性 定义如下: 在概率论中,我们知道,如果x跟y不相关,则 P(x,y) = P(x)P(y)。二者相关性越大,则 P(x,y) 就相比于 P(x)P(y) 越大。根据条件概率公式,你还可以写成 这也很好理解,在y出现的情况下x出现的条件概率 p(x|y) 阅读全文
posted @ 2019-10-03 08:43 韩雪溪 阅读(4105) 评论(0) 推荐(2) 编辑
摘要: 显性反馈行为:用户明确表示对物品喜好的行为。 隐性反馈行为:不能明确反映用户喜好的行为。 隐性反馈的特性 1.没有负反馈。隐性反馈无法判断是否不喜欢。而显性反馈,明显能区分是喜欢还是不喜欢。2.先天性具有噪声。用户购买了某物品,并不代表他喜欢,也许是送礼,也许买了之后发现不喜欢。3.显性反馈数值代表 阅读全文
posted @ 2019-10-01 15:43 韩雪溪 阅读(3312) 评论(0) 推荐(0) 编辑
摘要: 1.协同过滤算法概述 推荐系统应用数据分析技术,找出用户最可能喜欢的东西推荐给用户,现在很多电子商务网站都有这个应用。目前用的比较多、比较成熟的推荐算法是协同过滤(Collaborative Filtering,简称CF)推荐算法,CF的基本思想是根据用户之前的喜好以及其他兴趣相近的用户的选择来给用 阅读全文
posted @ 2019-09-30 20:11 韩雪溪 阅读(779) 评论(0) 推荐(0) 编辑
摘要: 本文转载于https://blog.csdn.net/u011095110/article/details/84403564 1.推荐算法概述 1)基于内容的推荐:这一类一般依赖于自然语言处理NLP的一些知识,通过挖掘文本的TF-IDF特征向量,来得到用户的偏好,进而做推荐。这类推荐算法可以找到用户 阅读全文
posted @ 2019-09-30 19:21 韩雪溪 阅读(910) 评论(0) 推荐(0) 编辑
摘要: One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。 One-Hot编码是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,它都是零值,它被 阅读全文
posted @ 2019-09-29 09:34 韩雪溪 阅读(482) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/yemanxiaozu/p/7680761.html 阅读全文
posted @ 2019-09-08 14:12 韩雪溪 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 李航统计学习方法第四章61页,后验概率最大化推到不太懂,参考了一些文章,懂了一丢丢(参考其他大佬的博客的,大部分都是大佬写的哈哈哈哈,我是搬运工,原文链接以放出) 在这里,设: 那么上式可以改为: 对于上式的期望风险求最小化,可以发现这是一个积分,积分中的中的各项以及都大于0,所以积分过程中不存在积 阅读全文
posted @ 2019-09-07 14:53 韩雪溪 阅读(966) 评论(0) 推荐(0) 编辑