上一页 1 ··· 40 41 42 43 44 45 46 47 48 ··· 69 下一页
摘要: 1、row_number() over()排序功能: (1) row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where group by order by 的执行。 partition by 用 阅读全文
posted @ 2018-07-05 15:38 静悟生慧 阅读(54995) 评论(0) 推荐(1) 编辑
摘要: Python3 range() 函数用法 Python3 内置函数 Python3 range() 函数返回的是一个可迭代对象(类型是对象),而不是列表类型, 所以打印的时候不会打印列表。 Python3 list() 函数是对象迭代器,可以把range()返回的可迭代对象转为一个列表,返回的变量类 阅读全文
posted @ 2018-07-05 10:42 静悟生慧 阅读(669) 评论(0) 推荐(0) 编辑
摘要: 一、XGBoost的优势 XGBoost算法可以给预测模型带来能力的提升。当我对它的表现有更多了解的时候,当我对它的高准确率背后的原理有更多了解的时候,我发现它具有很多优势: 1 正则化 标准GBDT 的实现没有像XGBoost这样的正则化步骤。正则化对减少过拟合也是有帮助的。 实际上,XGBoos 阅读全文
posted @ 2018-07-05 09:35 静悟生慧 阅读(4212) 评论(0) 推荐(0) 编辑
摘要: 1. scikit-learn GBDT类库概述 在sacikit-learn中,GradientBoostingClassifier为GBDT的分类类, 而GradientBoostingRegressor为GBDT的回归类。两者的参数类型完全相同,当然有些参数比如损失函数loss的可选择项并不相 阅读全文
posted @ 2018-07-04 17:46 静悟生慧 阅读(2335) 评论(0) 推荐(0) 编辑
摘要: 1. 交叉验证概述 进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们希望模型对于未知数据的泛化能力强,所以就需要模型验证这一过程来体现不同的模型对于未知数据的表现效果。 最先我们用训练准确度(用全部数据进行训练和测试)来衡量模型的表现,这种方法会导致模型过拟合;为了解决这一 阅读全文
posted @ 2018-07-02 21:43 静悟生慧 阅读(1148) 评论(0) 推荐(0) 编辑
摘要: %matplotlib inline 是一个魔法函数(Magic Functions)。官方给出的定义是:IPython有一组预先定义好的所谓的魔法函数(Magic Functions),你可以通过命令行的语法形式来访问它们。可见“%matplotlib inline”就是模仿命令行来访问magic 阅读全文
posted @ 2018-07-02 20:21 静悟生慧 阅读(1283) 评论(0) 推荐(0) 编辑
摘要: 在scikit-learn中,RandomForest的分类器是RandomForestClassifier,回归器是RandomForestRegressor,需要调参的参数包括两部分,第一部分是Bagging框架的参数,第二部分是CART决策树的参数。 一、Bagging框架的参数: 1. n_ 阅读全文
posted @ 2018-07-02 18:50 静悟生慧 阅读(5072) 评论(0) 推荐(0) 编辑
摘要: sql中的笛卡尔积 我们对数据库表进行操作时,经常会对多张表进行关联,多表连接查询大家肯定不会陌生,但是一不小心很容易出来庞大冗余的数据。 笛卡尔积数学概念 笛卡尔积是指在数学中,两个集合X和Y的笛卡尓积(Cartesian product),又称直积,表示为X × Y,第一个对象是X的成员而第二个 阅读全文
posted @ 2018-07-02 15:54 静悟生慧 阅读(1861) 评论(0) 推荐(0) 编辑
摘要: 起因:为了提高编码工作中的体验,Sublime Text:不仅具有华丽的界面,还支持插件扩展机制,用她来写代码,绝对是一种享受。 Vim难于上手,Eclipse,VS 体积庞大,即便体积轻巧迅速启动的Editplus、Notepad++,在显示和功能上,较之SublimeText也有不足。 所以,S 阅读全文
posted @ 2018-06-29 20:26 静悟生慧 阅读(239) 评论(0) 推荐(0) 编辑
摘要: LightGBM是微软旗下DMTK推出的Gradient Boosting框架,因为其快速高效,以后或许会成为数据挖掘竞赛中的又一个大杀器。地址:https://github.com/Microsoft/LightGBM 。 该项目刚开源就被受到热捧:三天之内GitHub上被star了1000+次, 阅读全文
posted @ 2018-05-22 10:50 静悟生慧 阅读(1677) 评论(0) 推荐(0) 编辑
上一页 1 ··· 40 41 42 43 44 45 46 47 48 ··· 69 下一页