摘要:
最近笔者在实验室做一些跨语言检索的研究,这是一种「面向相关性」的向量召回方法,然而在实际的搜索应用中,仅仅考虑相关性往往是不够的。尤其在候选量很大、计算资源有限的情况下,我们更希望优先召回高成交率的商品。 想要达到这种目标,需要在语义相关(Semantic)目标基础上增加「个性化」(Personal 阅读全文
摘要:
注意:此模式下不能用fit_generator() 方式训练 """ GPU test """ import os import sys os.system('pip install -i https://pypi.tuna.tsinghua.edu.cn/simple keras==2.3.1') 阅读全文
摘要:
1. Item2vec 作为 Word2vec 模型的推广,理论上可以利用任何序列型数据生成物品的 Embedding 向量, 这大大拓展了 Word2vec 的应用场景。广义上的 Item2vec 模型其实是物品向量化方法的统称,它可以利用不同的深度学习网络结构对物品特征进行 Embedding 阅读全文
摘要:
关于信息流推荐系统中召回模块建模采样方式的讨论大家好,我是CNU小学生,国内top10-20互联网公司小兵一枚,在此抛砖引玉,真诚希望各位读者不吝赐教。 1.信息流推荐系统中的召回业务 2019年知名互联网公司的信息流推荐系统项目可大致分为4个模块:用户画像,物品画像,召回,排序。 召回模块的功能是 阅读全文
摘要:
为了便于观察两种情况下的类别出现情况,可以通过合并索引观察: 比较: 阅读全文
摘要:
一是特征工程。 第二是算法定义和调参,就是你该选择什么样的算法,用什么样的参数进行调节。 第三是数据采集和清洗,接下来是实现这个算法并进行优化。‘I’代表和业务生产系统集成,所以我们就会简称为FaDAI这五大步骤。特征工程是这五大环节最重要的一部分 阅读全文
摘要:
对于Category的特征,我们通常有两种方法把它变成一个数字:Label编码和hash编码;使用sklearn的LabelEncoder可以实现把Label编码成数字。 现在主要介绍使用hash方法对类别进行编码 1.在大型工业场景下,会源源不断地出现新的item,新的用户,新的id,原先的one 阅读全文
摘要:
推荐系统中最重要的两部分是特征和模型,早期模型上没有很大突破的时候,人工特征工程是推荐系统发展的主要方向。在这里我总结一下做特征工程的思路和不同特征的处理方式。 1. 创造特征的思路 业务背景特征在推荐系统中猜测用户是否点击内容,可以仔细分析用户从打开手机到看到推荐内容的整个过程中的任何因素,比如这 阅读全文
摘要:
最近得到几点感悟: 1)什么是顺势而为,只有到达一定境界、有市场的沉淀,才能深有体会。总之,可以顺大势,逆小势。H4、H1、M15锁定三个固有时间周期,且要随时切换,这,需要磨练 2)设置目标点位: a)M15在H1内,顺势情况下,目标看到TP3;逆势情况下,目标看到TP2 b)H1在H4内,同样, 阅读全文
摘要:
参考地址:https://zhuanlan.zhihu.com/p/398630370https://www.modb.pro/db/152185https://blog.csdn.net/xiewenbo/article/details/103859633?spm=1001.2101.3001.6 阅读全文