摘要: 1. 交叉验证概述 进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们希望模型对于未知数据的泛化能力强,所以就需要模型验证这一过程来体现不同的模型对于未知数据的表现效果。 最先我们用训练准确度(用全部数据进行训练和测试)来衡量模型的表现,这种方法会导致模型过拟合;为了解决这一 阅读全文
posted @ 2018-07-02 21:43 静悟生慧 阅读(1148) 评论(0) 推荐(0) 编辑
摘要: %matplotlib inline 是一个魔法函数(Magic Functions)。官方给出的定义是:IPython有一组预先定义好的所谓的魔法函数(Magic Functions),你可以通过命令行的语法形式来访问它们。可见“%matplotlib inline”就是模仿命令行来访问magic 阅读全文
posted @ 2018-07-02 20:21 静悟生慧 阅读(1283) 评论(0) 推荐(0) 编辑
摘要: 在scikit-learn中,RandomForest的分类器是RandomForestClassifier,回归器是RandomForestRegressor,需要调参的参数包括两部分,第一部分是Bagging框架的参数,第二部分是CART决策树的参数。 一、Bagging框架的参数: 1. n_ 阅读全文
posted @ 2018-07-02 18:50 静悟生慧 阅读(5072) 评论(0) 推荐(0) 编辑
摘要: sql中的笛卡尔积 我们对数据库表进行操作时,经常会对多张表进行关联,多表连接查询大家肯定不会陌生,但是一不小心很容易出来庞大冗余的数据。 笛卡尔积数学概念 笛卡尔积是指在数学中,两个集合X和Y的笛卡尓积(Cartesian product),又称直积,表示为X × Y,第一个对象是X的成员而第二个 阅读全文
posted @ 2018-07-02 15:54 静悟生慧 阅读(1861) 评论(0) 推荐(0) 编辑