随笔分类 -  机器学习&深度学习

用于记录一些机器学习与深度学习的知识
摘要:背景 在CTR预估任务中,线性模型仍占有半壁江山。利用手工构造的交叉组合特征来使线性模型具有“记忆性”,使模型记住共现频率较高的特征组合,往往也能达到一个不错的baseline,且可解释性强。但这种方式有着较为明显的缺点:首先,特征工程需要耗费太多精力。其次,因为模型是强行记住这些组合特征的,所以对 阅读全文
posted @ 2019-11-17 22:30 yinzm 阅读(6127) 评论(0) 推荐(0)
摘要:背景 特征工程是绕不开的话题,巧妙的特征组合也许能够为模型带来质的提升。但同时,特征工程耗费的资源也是相当可观的,对于后期模型特征的维护、模型线上部署不太友好。2016年,微软提出Deep Crossing模型,旨在解决特征工程中特征组合的难题,降低人力特征组合的时间开销,通过模型自动学习特征的组合 阅读全文
posted @ 2019-11-09 21:09 yinzm 阅读(2994) 评论(0) 推荐(1)
摘要:背景 上一篇文章介绍了FNN [2],在FM的基础上引入了DNN对特征进行高阶组合提高模型表现。但FNN并不是完美的,针对FNN的缺点上交与UCL于2016年联合提出一种新的改进模型PNN(Product based Neural Network)。 PNN同样引入了DNN对低阶特征进行组合,但与F 阅读全文
posted @ 2019-11-01 11:21 yinzm 阅读(2691) 评论(0) 推荐(0)
摘要:背景 在FM之后出现了很多基于FM的升级改造工作,由于计算复杂度等原因,FM通常只对特征进行二阶交叉。当面对海量高度稀疏的用户行为反馈数据时,二阶交叉往往是不够的,三阶、四阶甚至更高阶的组合交叉能够进一步提升模型学习能力。如何能在引入更高阶的特征组合的同时,将计算复杂度控制在一个可接受的范围内? 参 阅读全文
posted @ 2019-10-29 14:36 yinzm 阅读(8710) 评论(0) 推荐(0)
摘要:背景 在CTR/CVR预估任务中,除了FM模型[2] 之外,后起之秀FFM(Field aware Factorization Machine)模型同样表现亮眼。FFM可以看作是FM的升级版,Yuchi Juan于2016年提出该模型,但其诞生是受启于Rendle在2010年发表的另一个模型PITF 阅读全文
posted @ 2019-10-21 10:48 yinzm 阅读(1308) 评论(0) 推荐(0)
摘要:背景 在推荐领域CTR(click through rate)预估任务中,最常用到的baseline模型就是LR(Logistic Regression)。对数据进行特征工程,构造出大量单特征,编码之后送入模型。这种线性模型的优势在于,运算速度快可解释性强,在特征挖掘完备且训练数据充分的前提下能够达 阅读全文
posted @ 2019-10-03 15:17 yinzm 阅读(1656) 评论(0) 推荐(0)
摘要:Deep Learning for Event-Driven Stock Prediction [Xiao Ding, Yue Zhang, Ting Liu, Junwen Duan] 2015, IJCAI 论文链接:http://www.ijcai.org/Proceedings/15/Pap 阅读全文
posted @ 2018-03-05 11:12 yinzm 阅读(2310) 评论(0) 推荐(0)
摘要:Using Structured Event to Predict Stock Price Movement: An Empirical Investigation [Xiao Ding, Yue Zhang, Ting Liu, Junwen Duan] 2014,EMNLP 论文链接:http: 阅读全文
posted @ 2018-03-05 11:08 yinzm 阅读(499) 评论(0) 推荐(0)
摘要:在上一篇《TensorFlow入门之MNIST样例代码分析》中,我们讲解了如果来用一个三层全连接网络实现手写数字识别。但是在实际运用中我们需要更有效率,更加灵活的代码。在TensorFlow实战这本书中给出了更好的实现,他将程序分为三个模块,分别是前向传播过程模块,训练模块和验证检测模块。并且在这个 阅读全文
posted @ 2017-07-05 21:46 yinzm 阅读(12091) 评论(0) 推荐(0)
摘要:这几天想系统的学习一下TensorFlow,为之后的工作打下一些基础。看了下 "《TensorFlow:实战Google深度学习框架》" 这本书,目前个人觉得这本书还是对初学者挺友好的,作者站在初学者的角度讲解TensorFlow,所以比较容易理解。这篇博文主要是为了分析其中的一个经典代码,MNIS 阅读全文
posted @ 2017-07-03 14:08 yinzm 阅读(10257) 评论(0) 推荐(2)
摘要:缘由 以下博客都是我在学习过程中看到的一些知识讲解非常好的博文,就不转载了,直接给出链接方便以后重复访问。有了自己的理解之后再重新整理资料发布吧 : ) sklearn系列 + http://www.cnblogs.com/jasonfreak/tag/sklearn/ ROC和AUC介绍以及如何计 阅读全文
posted @ 2017-02-28 15:20 yinzm 阅读(304) 评论(0) 推荐(0)