上一页 1 ··· 4 5 6 7 8 9 10 下一页
摘要: Win下更改jupyter主题 Themes地址 本人环境 Win+Conda 开始使用pip 安装,发现无法使用pip,修改环境变量,将D:\Program Files\Conda\Scripts加入Path中 再次使用pip,报错无SSL,网上查找发现需将D:\Program Files\Con 阅读全文
posted @ 2019-05-03 11:10 布尔先生 阅读(629) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘概念与技术 定义挖掘目标–>数据取样–>数据探索–>数据预处理–>挖掘建模–>模型评价 第一章、数据 挖掘的数据类型:时间序列,序列,数据流,时间空间数据,多媒体数据,文本数据,图,社会网络和web数据; 挖掘:知识类型、使用的技术、目标应用的技术、挖掘任务分类。 衡量取样数据质量的标准: 阅读全文
posted @ 2018-05-25 10:04 布尔先生 阅读(1647) 评论(0) 推荐(0) 编辑
摘要: 常见的多模型融合算法 多模型融合算法可以比单一模型算法有极为明显的效果提升。但是怎样进行有效的融合,充分发挥各个算法的长处?这里总结一些常见的融合方法: 1. 线性加权融合法 线性加权是最简单易用的融合算法,工程实现非常方便,只需要汇总单一模型的结果,然后按不同算法赋予不同的权重,将多个推荐算法的结 阅读全文
posted @ 2018-05-01 08:34 布尔先生 阅读(11303) 评论(0) 推荐(0) 编辑
摘要: 简介 如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。 阅读全文
posted @ 2018-04-13 17:53 布尔先生 阅读(17186) 评论(0) 推荐(1) 编辑
摘要: XGBoost参数 在运行XGboost之前,必须设置三种类型成熟:general parameters,booster parameters和task parameters: General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的booster 阅读全文
posted @ 2018-04-13 17:52 布尔先生 阅读(297) 评论(0) 推荐(0) 编辑
摘要: xgboost是基于GBDT原理进行改进的算法,效率高,并且可以进行并行化运算,而且可以在训练的过程中给出各个特征的评分,从而表明每个特征对模型训练的重要性, 调用的源码就不准备详述,本文主要侧重的是计算的原理,函数get_fscore源码如下,源码来自安装包:xgboost/python-pack 阅读全文
posted @ 2018-04-13 17:51 布尔先生 阅读(4534) 评论(0) 推荐(0) 编辑
摘要: 一、数据集预处理 1、数据读入 2、数据划分 二、特征工程 1、提取其他特征 2、提取优惠券相关特征 3、提取商户相关特征 4、提取用户的相关特征 5、用户和商店之间联系的特征 三、特征组合 四、模型训练 对特征筛选,训练,方便除去对标签影响因子小的特征属性,即剪枝 五、总结 本次按着大佬的思路做了 阅读全文
posted @ 2018-04-13 17:43 布尔先生 阅读(910) 评论(0) 推荐(0) 编辑
摘要: 1.快捷键 Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。 命令模式 (按键 Esc 开启) Enter : 转入编辑模式 Shift-Enter : 运行本单元,选中下个单 阅读全文
posted @ 2018-04-09 15:58 布尔先生 阅读(555) 评论(0) 推荐(0) 编辑
摘要: 1. 背景 1.1 Gradient Boosting Gradient Boosting是一种Boosting的方法,它主要的思想是,每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数是评价模型性能(一般为拟合程度+正则项),认为损失函数越小,性能越好。而让损失函数持续下降,就能使得模 阅读全文
posted @ 2018-04-09 14:32 布尔先生 阅读(636) 评论(0) 推荐(0) 编辑
摘要: 1、背景 CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression)[1],LR是广义线性模型,与传统线性模型相比,LR使用了Logit变 阅读全文
posted @ 2018-04-09 14:29 布尔先生 阅读(654) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 下一页