摘要: 大文本 通过 hadoop spark map reduce 获取 特征列 的 属性值 计算速度 阅读全文
posted @ 2018-05-18 23:33 papering 阅读(155) 评论(0) 推荐(0) 编辑
摘要: Python读取大文件(GB) - CSDN博客 https://blog.csdn.net/shudaqi2010/article/details/54017766 阅读全文
posted @ 2018-05-18 22:40 papering 阅读(298) 评论(0) 推荐(0) 编辑
摘要: Python获取CPU、内存使用率以及网络使用状态代码_python_脚本之家 http://www.jb51.net/article/134714.htm 阅读全文
posted @ 2018-05-18 22:29 papering 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 业务的紧急程度 阅读全文
posted @ 2018-05-18 22:01 papering 阅读(200) 评论(0) 推荐(0) 编辑
摘要: pageA 有图片 a b c ... 由于网速限制,我怎样指定 先加载c 后加载a 最后加载 b呢,【下载顺序】 控制懒加载 lazy load 的顺序 就是在lazy load 的同时,控制顺序 jquery-lazyload延迟加载图片 及 加载顺序 bug 修复 - 吃饭了吗 - 博客园 h 阅读全文
posted @ 2018-05-18 22:00 papering 阅读(351) 评论(0) 推荐(0) 编辑
摘要: 用户特征文件 userFeature.data 每 行 代 表 一 个 用 户 的 特 征 数 据, 格 式 为: “uid|features”,uid 和 features 用竖线“|”分隔。其中 feature 采用 vowpal wabbit(https://github.com/JohnLa 阅读全文
posted @ 2018-05-18 21:45 papering 阅读(342) 评论(0) 推荐(0) 编辑
摘要: 数据 读写 函数 方法中 传参 业务逻辑中 重试次数 休息时间 灵活 阅读全文
posted @ 2018-05-18 12:02 papering 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 批处理 而非 单个处理 阅读全文
posted @ 2018-05-18 11:45 papering 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 一键切换 开关 生产 数据 和 测试数据的 分离 快速的测试 快速的数据结果 反馈 是提高工作效率的关键 方法之一 阅读全文
posted @ 2018-05-18 11:09 papering 阅读(232) 评论(0) 推荐(0) 编辑
摘要: 更新中的表 游标的控制 阅读全文
posted @ 2018-05-18 10:32 papering 阅读(119) 评论(0) 推荐(0) 编辑
摘要: #5KB/per结合数据库配置mylimit = 50 阅读全文
posted @ 2018-05-18 09:52 papering 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 将去重逻辑从数据库剥离,交给代码执行环境,提高数据库生产效率 def get_produced_uid_l(produced_status, lim): q = 'SELECT uid FROM (SELECT uid,COUNT(1) AS c FROM {} WHERE status={} GROUP BY uid) AS t WHERE t.c>{}'.format(... 阅读全文
posted @ 2018-05-18 09:24 papering 阅读(350) 评论(0) 推荐(0) 编辑
摘要: ctr ffm 阅读全文
posted @ 2018-05-18 07:59 papering 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 线程安全 阅读全文
posted @ 2018-05-18 07:59 papering 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 谷歌开发者中文博客: TensorFlow 特征列介绍 http://developers.googleblog.cn/2017/12/tensorflow.html TensorFlow 特征列介绍 - CSDN博客 https://blog.csdn.net/jILRvRTrc/article/ 阅读全文
posted @ 2018-05-18 07:54 papering 阅读(276) 评论(0) 推荐(0) 编辑