07 2019 档案
摘要:本章之前提到的推荐系统算法主要集中研究了如何联系用户兴趣和物品,将最符合用户兴趣的物品推荐给用户,但这些算法都忽略了一点,就是用户所处的上下文(context)。 这些上下文包括用户访问推荐系统的时间、地点、心情等,对于提高推荐系统的推荐系统是非常重要的。 比如,一个卖衣服的推荐系统在冬天和夏天应该
阅读全文
摘要:荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖不同的媒介。目前流行的推荐系统基本上通过3种方式联系用户兴趣和物品。如图4-1所示, 第一种方式是利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品,这就是前面提到的基于物品的算法。 第二种方式是利用和用户兴趣相似的其他用户,给用户推荐那些
阅读全文
摘要:推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,因此大量的用户行为数据就成为推荐系统的重要组成部分和先决条件。对于很多像百度、当当这样的网站来说,这或许不是个问题,因为它们目前已经积累了大量的用户数据。但是对于很多做纯粹推荐系统的网站(比如Jinni和Pandora),或者很多在开始阶
阅读全文
摘要:一、用户行为数据 一个用户行为表示为6部分,即产生行为的用户和行为的对象、行为的种类、产生行为的上下文、行为的内容和权重。用户行为的统一表示如下: user id 产生行为的用户的唯一标识item id 产生行为的对象的唯一标识behavior type 行为的种类(比如是购买还是浏览)contex
阅读全文
摘要:国外有一个很著名的条件随机场的教程,是英文的,原文: http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/ 一个比较容易理解的入门小教程,原文:http://www.jianshu.com/p/55755
阅读全文
摘要:机器学习科研的十年 链接:https://zhuanlan.zhihu.com/p/74249758 选择做什么的眼光和做出好结果的能力一样重要,眼界决定了工作影响力的上界,能力决定了到底是否到达那个上界。 交大时敖平老师曾经和我说过,一个人做一件简单的事情和困难的事情其实是要花费一样多的时间。因为
阅读全文
摘要:推荐系统的主要任务:联系 用户 和 信息,一方面帮助用户发现对自己 有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。 也就是帮助用户解决 信息过载(information overload)的问题。 搜索引擎和 推荐系统的区别: 和搜索引擎一样,推荐
阅读全文
摘要:很好的解释博客: https://www.cnblogs.com/AndyJee/p/3491487.html#4291028 行列式的定义: 行列式是由一些数据排列成的方阵经过规定的计算方法而得到的一个数。 当然,如果行列式中含有未知数,那么行列式就是一个多项式。它本质上代表一个数值,这点请与矩阵
阅读全文
摘要:一、修改hive表注释 二、修改hive表字段注释
阅读全文
摘要:矩阵理解一:https://blog.csdn.net/myan/article/details/647511 矩阵理解二:https://blog.csdn.net/myan/article/details/649018 矩阵理解三:https://blog.csdn.net/myan/artic
阅读全文
摘要:在运维过程中,有时候会收到用户这样的抱怨:为什么别人发给我的邮件我都收不到,我的邮件也发不出去了? Outlook 2016图标上显示着一个红叉... 这种情况有时候是因为Outlook正在脱机工作,在Outlook右下角可以看到这样的信息; “正在脱机工作” 针对这种情况,一般先让用户登录OWA网
阅读全文
摘要:1、不同类别文本量统计,类别不平衡差异 2、文本长度统计 3、文本处理,比如文本语料中简体与繁体共存,这会加大模型的学习难度。因此,他们对数据进行繁体转简体的处理。 同时,过滤掉了对分类没有任何作用的停用词,从而降低了噪声。 4、上文提到训练数据中,存在严重的样本不均衡问题,如果不对该问题做针对性的
阅读全文
摘要:在广告领域,预测用户点击率(Click Through Rate,简称CTR)领域近年也有大量关于深度学习方面的研究,仅这两年就出现了不少于二十多种方法 本文就近几年CTR预估领域中学术界的经典方法进行探究, 并比较各自之间模型设计的初衷和各自优缺点。 通过十种不同CTR深度模型的比较,不同的模型本
阅读全文