摘要: 本例展示怎样在一个管道中使用FunctionTransformer.如果你知道你的数据集的第一主成分与分类任务无关,你可以使用FunctionTransformer选取除PCA转化的数据的第一列之外的全部数据. 阅读全文
posted @ 2016-10-05 21:13 Tacey Wong 阅读(3249) 评论(0) 推荐(0) 编辑
摘要: It shows how to use and to approximate the feature map of an RBF kernel for classification with an SVM on the digits dataset. Results using a linear S 阅读全文
posted @ 2016-10-05 20:18 Tacey Wong 阅读(1123) 评论(0) 推荐(0) 编辑
摘要: [占位 未完成]scikit learn一般实例之十一:异构数据源的特征联合 Datasets can often contain components of that require different feature extraction and processing pipelines. Th 阅读全文
posted @ 2016-10-05 20:11 Tacey Wong 阅读(433) 评论(0) 推荐(0) 编辑
摘要: [占位 未完成]scikit learn一般实例之十:核岭回归和SVR的比较 阅读全文
posted @ 2016-10-05 20:07 Tacey Wong 阅读(1054) 评论(0) 推荐(0) 编辑
摘要: Johnson–Lindenstrauss 引理表明任何高维数据集均可以被随机投影到一个较低维度的欧氏空间,同时可以控制pairwise距离的失真. 理论边界 由一个随机投影P所引入的失真是确定的,这是由于p定义了一个esp embedding.其概率论定义如下: u和v是从一个形状是[n样例,n特 阅读全文
posted @ 2016-10-05 20:03 Tacey Wong 阅读(1365) 评论(0) 推荐(0) 编辑
摘要: 本例模拟一个多标签文档分类问题.数据集基于下面的处理随机生成: + 选取标签的数目:泊松(n~Poisson,n_labels) + n次,选取类别C:多项式(c~Multinomial,theta) + 选取文档长度:泊松(k~Poisson,length) + k次,选取一个单词:多项式(w~M 阅读全文
posted @ 2016-10-05 19:30 Tacey Wong 阅读(15309) 评论(0) 推荐(0) 编辑