随笔分类 - 机器学习&深度学习
用于记录一些机器学习与深度学习的知识
摘要:背景 在CTR预估任务中,线性模型仍占有半壁江山。利用手工构造的交叉组合特征来使线性模型具有“记忆性”,使模型记住共现频率较高的特征组合,往往也能达到一个不错的baseline,且可解释性强。但这种方式有着较为明显的缺点:首先,特征工程需要耗费太多精力。其次,因为模型是强行记住这些组合特征的,所以对
阅读全文
摘要:背景 特征工程是绕不开的话题,巧妙的特征组合也许能够为模型带来质的提升。但同时,特征工程耗费的资源也是相当可观的,对于后期模型特征的维护、模型线上部署不太友好。2016年,微软提出Deep Crossing模型,旨在解决特征工程中特征组合的难题,降低人力特征组合的时间开销,通过模型自动学习特征的组合
阅读全文
摘要:背景 上一篇文章介绍了FNN [2],在FM的基础上引入了DNN对特征进行高阶组合提高模型表现。但FNN并不是完美的,针对FNN的缺点上交与UCL于2016年联合提出一种新的改进模型PNN(Product based Neural Network)。 PNN同样引入了DNN对低阶特征进行组合,但与F
阅读全文
摘要:背景 在FM之后出现了很多基于FM的升级改造工作,由于计算复杂度等原因,FM通常只对特征进行二阶交叉。当面对海量高度稀疏的用户行为反馈数据时,二阶交叉往往是不够的,三阶、四阶甚至更高阶的组合交叉能够进一步提升模型学习能力。如何能在引入更高阶的特征组合的同时,将计算复杂度控制在一个可接受的范围内? 参
阅读全文
摘要:背景 在CTR/CVR预估任务中,除了FM模型[2] 之外,后起之秀FFM(Field aware Factorization Machine)模型同样表现亮眼。FFM可以看作是FM的升级版,Yuchi Juan于2016年提出该模型,但其诞生是受启于Rendle在2010年发表的另一个模型PITF
阅读全文
摘要:背景 在推荐领域CTR(click through rate)预估任务中,最常用到的baseline模型就是LR(Logistic Regression)。对数据进行特征工程,构造出大量单特征,编码之后送入模型。这种线性模型的优势在于,运算速度快可解释性强,在特征挖掘完备且训练数据充分的前提下能够达
阅读全文
摘要:Deep Learning for Event-Driven Stock Prediction [Xiao Ding, Yue Zhang, Ting Liu, Junwen Duan] 2015, IJCAI 论文链接:http://www.ijcai.org/Proceedings/15/Pap
阅读全文
摘要:Using Structured Event to Predict Stock Price Movement: An Empirical Investigation [Xiao Ding, Yue Zhang, Ting Liu, Junwen Duan] 2014,EMNLP 论文链接:http:
阅读全文
摘要:在上一篇《TensorFlow入门之MNIST样例代码分析》中,我们讲解了如果来用一个三层全连接网络实现手写数字识别。但是在实际运用中我们需要更有效率,更加灵活的代码。在TensorFlow实战这本书中给出了更好的实现,他将程序分为三个模块,分别是前向传播过程模块,训练模块和验证检测模块。并且在这个
阅读全文
摘要:这几天想系统的学习一下TensorFlow,为之后的工作打下一些基础。看了下 "《TensorFlow:实战Google深度学习框架》" 这本书,目前个人觉得这本书还是对初学者挺友好的,作者站在初学者的角度讲解TensorFlow,所以比较容易理解。这篇博文主要是为了分析其中的一个经典代码,MNIS
阅读全文
摘要:缘由 以下博客都是我在学习过程中看到的一些知识讲解非常好的博文,就不转载了,直接给出链接方便以后重复访问。有了自己的理解之后再重新整理资料发布吧 : ) sklearn系列 + http://www.cnblogs.com/jasonfreak/tag/sklearn/ ROC和AUC介绍以及如何计
阅读全文