摘要: 作者:许铁-巡洋舰科技链接:https://www.zhihu.com/question/37082800/answer/126430702来源:知乎著作权归作者所有,转载请联系作者获得授权。 作者:许铁-巡洋舰科技链接:循环神经网络RNN打开手册 - 混沌巡洋舰 - 知乎专栏来源:知乎著作权归作者 阅读全文
posted @ 2016-12-20 14:29 Django's blog 阅读(2353) 评论(0) 推荐(0) 编辑
摘要: Word2Vec 作者、脸书科学家 Mikolov 文本分类新作 fastText:方法简单,号称并不需要深度学习那样几小时或者几天的训练时间,在普通 CPU 上最快几十秒就可以训练模型,得到不错的结果。 1. fastText 原理 fastText 方法包含三部分:模型架构、层次 Softmax 阅读全文
posted @ 2016-12-20 14:23 Django's blog 阅读(1652) 评论(0) 推荐(0) 编辑
摘要: 转:http://www.cnblogs.com/pinard/p/6143927.html 在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参中的一些要点。 1. scikit-learn GBD 阅读全文
posted @ 2016-12-20 10:32 Django's blog 阅读(60414) 评论(5) 推荐(2) 编辑
摘要: 利用GBDT模型构造新特征具体方法 数据挖掘入门与实战 公众号: datadw 实际问题中,可直接用于机器学**模型的特征往往并不多。能否从“混乱”的原始log中挖掘到有用的特征,将会决定机器学**模型效果的好坏。引用下面一句流行的话: 特征决定了所有算法效果的上限,而不同的算法只是离这个上限的距离 阅读全文
posted @ 2016-12-20 10:22 Django's blog 阅读(1242) 评论(0) 推荐(0) 编辑
摘要: 在网上看到一篇对从代码层面理解gbdt比较好的文章,转载记录一下: GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做 阅读全文
posted @ 2016-12-20 10:05 Django's blog 阅读(535) 评论(0) 推荐(0) 编辑
摘要: 1.FM背景 在计算广告中,CTR预估(click-through rate)是非常重要的一个环节,因为DSP后面的出价要依赖于CTR预估的结果。在前面的相关博文中,我们已经提到了CTR中相关特征工程的做法。对于特征组合来说,业界现在通用的做法主要有两大类:FM系列与Tree系列。今天,我们就来讲讲 阅读全文
posted @ 2016-12-20 10:01 Django's blog 阅读(1587) 评论(0) 推荐(0) 编辑
摘要: 转载请注明本文链接:http://www.cnblogs.com/EE-NovRain/p/3810737.html 现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和数据流,google先后三年时间( 阅读全文
posted @ 2016-12-20 10:00 Django's blog 阅读(373) 评论(0) 推荐(0) 编辑