摘要: 1.快捷键 Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。 命令模式 (按键 Esc 开启) Enter : 转入编辑模式 Shift-Enter : 运行本单元,选中下个单 阅读全文
posted @ 2018-04-09 15:58 布尔先生 阅读(555) 评论(0) 推荐(0) 编辑
摘要: 1. 背景 1.1 Gradient Boosting Gradient Boosting是一种Boosting的方法,它主要的思想是,每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数是评价模型性能(一般为拟合程度+正则项),认为损失函数越小,性能越好。而让损失函数持续下降,就能使得模 阅读全文
posted @ 2018-04-09 14:32 布尔先生 阅读(636) 评论(0) 推荐(0) 编辑
摘要: 1、背景 CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression)[1],LR是广义线性模型,与传统线性模型相比,LR使用了Logit变 阅读全文
posted @ 2018-04-09 14:29 布尔先生 阅读(654) 评论(0) 推荐(0) 编辑
摘要: 一:问题描述 题目中涉及到严格的时间概念,例如:预测未来N天的流量(人流,销售等),预测未来N天内的用户-对象对(用户-商品等)的问题等,都可以利用滑窗法解决。诸如类似形式的问题,尤其是要有严格的时间概念的问题。 二:基本方法 假设:题目描述为预测未来N天的流量信息,其中N的取值为大于等于1。基本诸 阅读全文
posted @ 2018-04-09 10:04 布尔先生 阅读(1850) 评论(0) 推荐(0) 编辑