Tacey Wong

2016年10月5日

摘要： [占位未完成]scikit learn一般实例之十一:异构数据源的特征联合 Datasets can often contain components of that require different feature extraction and processing pipelines. Th 阅读全文

posted @ 2016-10-05 20:11 Tacey Wong 阅读(430) 评论(0) 推荐(0) 编辑

[占位-未完成]scikit-learn一般实例之十:核岭回归和SVR的比较

摘要： [占位未完成]scikit learn一般实例之十:核岭回归和SVR的比较阅读全文

posted @ 2016-10-05 20:07 Tacey Wong 阅读(1050) 评论(0) 推荐(0) 编辑

[未完成]scikit-learn一般实例之九:用于随机投影嵌入的Johnson–Lindenstrauss lemma边界

摘要： Johnson–Lindenstrauss 引理表明任何高维数据集均可以被随机投影到一个较低维度的欧氏空间,同时可以控制pairwise距离的失真. 理论边界由一个随机投影P所引入的失真是确定的,这是由于p定义了一个esp embedding.其概率论定义如下: u和v是从一个形状是[n样例,n特阅读全文

posted @ 2016-10-05 20:03 Tacey Wong 阅读(1360) 评论(0) 推荐(0) 编辑

scikit-learn一般实例之八:多标签分类

摘要：本例模拟一个多标签文档分类问题.数据集基于下面的处理随机生成: + 选取标签的数目:泊松(n~Poisson,n_labels) + n次,选取类别C:多项式(c~Multinomial,theta) + 选取文档长度:泊松(k~Poisson,length) + k次,选取一个单词:多项式(w~M 阅读全文

posted @ 2016-10-05 19:30 Tacey Wong 阅读(15295) 评论(0) 推荐(0) 编辑

2016年10月4日

scikit-learn一般实例之七:使用多输出评估器进行人脸完成

摘要：本例将展示使用多输出评估期来实现图像完成.目标是根据给出的上半部分人脸预测人脸的下半部分. 第一列展示的是真实的人脸,接下来的列分别展示了随机森林,K近邻,线性回归和岭回归对人脸下半部分的预测. 阅读全文

posted @ 2016-10-04 23:11 Tacey Wong 阅读(790) 评论(0) 推荐(0) 编辑

scikit-learn一般实例之六:构建评估器之前进行缺失值填充

摘要：本例将会展示对确实值进行填充能比简单的对样例中缺失值进行简单的丢弃能获得更好的结果.填充不一定能提升预测精度,所以请通过交叉验证进行检验.有时删除有缺失值的记录或使用标记符号会更有效. 缺失值可以被替换为均值,中值,或使用超参数最高频值.中值是对于具有可以主宰的高强度值数据是有较好鲁棒性的评估期( 阅读全文

posted @ 2016-10-04 21:48 Tacey Wong 阅读(1418) 评论(0) 推荐(0) 编辑

scikit-learn一般实例之四:使用管道和GridSearchCV选择降维

摘要：本例构建一个管道来进行降维和预测的工作:先降维,接着通过支持向量分类器进行预测.本例将演示与在网格搜索过程进行单变量特征选择相比,怎样使用GrideSearchCV和管道来优化单一的CV跑无监督的PCA降维与NMF降维不同类别评估器。 (原文:This example constructs a pi 阅读全文

posted @ 2016-10-04 21:16 Tacey Wong 阅读(9558) 评论(0) 推荐(1) 编辑

scikit-learn一般实例之四:管道的使用:链接一个主成分分析和Logistic回归

摘要：主成分分析(PCA)进行无监督的降维，而逻辑回归进行预测. 我们使用来设置PCA的维度绘制PCA图谱预测阅读全文

posted @ 2016-10-04 20:46 Tacey Wong 阅读(1464) 评论(0) 推荐(0) 编辑

scikit-learn一般实例之三:连接多个特征提取方法

摘要：在很多现实世界的例子中,有很多从数据集中提取特征的方法.很多时候我们需要结合多种方法获得好的效果.本例将展示怎样使用通过主成分分析和单变量选择相进行特征结合. 结合使用转换器的好处是它允许在整个过程中进行交叉验证和网格搜索。在本例中数据集上使用组合的方法并没有什么实际作用,仅用来展示怎么使用阅读全文

posted @ 2016-10-04 16:24 Tacey Wong 阅读(1806) 评论(0) 推荐(0) 编辑

scikit-learn一般实例之一:保序回归(Isotonic Regression)

摘要：对生成的数据进行保序回归的一个实例.保序回归能在训练数据上发现一个非递减逼近函数的同时最小化均方误差。这样的模型的好处是，它不用假设任何形式的目标函数，(如线性)。为了比较，这里用一个线性回归作为参照。阅读全文

posted @ 2016-10-04 15:53 Tacey Wong 阅读(8860) 评论(0) 推荐(0) 编辑

公告