04 2019 档案
摘要:转载:https://www.infoq.cn/article/XA055tpFrprUy*0UBdCb https://www.zhihu.com/question/20830906/answer/681688041
阅读全文
摘要:1、机器内存不足的解决方案:EasyEnsemble的方法,即多次下采样(放回采样,这样产生的训练集才相互独立)产生多个不同的训练集,进而训练多个不同的分类器,通过组合多个分类器的结果得到最终的结果 2、统计历史点击率时的平滑技巧 https://cloud.tencent.com/develope
阅读全文
摘要:https://www.infoq.cn/article/XA055tpFrprUy*0UBdCb 1、Wide & Deep 模型 https://arxiv.org/abs/1606.07792 https://blog.csdn.net/google19890102/article/detai
阅读全文
摘要:read_csv函数 常见参数: header: header=None 指明原始文件数据没有列索引,这样read_csv会自动加上列索引,除非你给定列索引的名字。 header=0 表示文件第0行(即第一行,索引从0开始)为列索引,这样加names会替换原来的列索引。如果没有传入names参数,默
阅读全文