2017 年 12月 6 日随笔档案 - Michael2397

sklearn保存模型

摘要：最后可以知道joblib在使用上比较容易，读取速度也相对pickle快。阅读全文

posted @ 2017-12-06 23:18 Michael2397 阅读(167) 评论(0) 推荐(0) 编辑

sklearn解决过拟合的例子

摘要： Learning curve 检视过拟合 sklearn.learning_curve 中的 learning curve 可以很直观的看出我们的 model 学习的进度, 对比发现有没有 overfitting 的问题. 然后我们可以对我们的 model 进行调整, 克服 overfitting 阅读全文

posted @ 2017-12-06 22:57 Michael2397 阅读(3831) 评论(0) 推荐(0) 编辑

sklearn交叉验证法(Cross Validation)

摘要：一般来说准确率(accuracy)会用于判断分类(Classification)模型的好坏。一般来说平均方差(Mean squared error)会用于判断回归(Regression)模型的好坏。阅读全文

posted @ 2017-12-06 22:12 Michael2397 阅读(840) 评论(0) 推荐(0) 编辑

sklearn正规化（Normalization或者scale）

摘要： from sklearn import preprocessing import numpy as np a = np.array([[10,2.7,3.6],[-100,5,-2],[120,20,40]],dtype=np.float64) print(a) print(preprocessing.scale(a)) from sklearn import preprocessin... 阅读全文

posted @ 2017-12-06 21:43 Michael2397 阅读(970) 评论(0) 推荐(0) 编辑

sklearn有关参数

摘要： from sklearn import datasets from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt #加载数据 loaded_data = datasets.load_boston() data_X = loaded_data.data data_Y = loaded_da... 阅读全文

posted @ 2017-12-06 21:06 Michael2397 阅读(174) 评论(0) 推荐(0) 编辑

sklearn常用数据的使用

摘要： from sklearn import datasets from sklearn.linear_model import LinearRegression #加载数据 loaded_data = datasets.load_boston() data_X = loaded_data.data data_Y = loaded_data.target #是否需要对数据进行拆分 #定义模型 mode... 阅读全文

posted @ 2017-12-06 20:56 Michael2397 阅读(193) 评论(0) 推荐(0) 编辑

sklearn实现聚类

摘要： import numpy as np from sklearn import datasets from sklearn.cross_validation import train_test_split from sklearn.neighbors import KNeighborsClassifier iris = datasets.load_iris() iris_X = iris... 阅读全文

posted @ 2017-12-06 20:29 Michael2397 阅读(718) 评论(0) 推荐(0) 编辑

sklearn

摘要：基于Anaconda安装：http://blog.csdn.net/tz_zs/article/details/73459800 官方地址：http://scikit-learn.org/stable/tutorial/index.html 中文0.18文档：http://cwiki.apachec 阅读全文

posted @ 2017-12-06 20:28 Michael2397 阅读(116) 评论(0) 推荐(0) 编辑

Michael2397