摘要:
Reference : http://my.oschina.net/u/175377/blog/74406试验性的Numpy教程原文来自Tentative NumPy Tutorial目录先决条件基础篇一个例子13创建数组打印数组基本运算通用函数(ufunc)索引,切片和迭代形状操作更改数组的形状组... 阅读全文
摘要:
reference :http://my.oschina.net/u/175377/blog/84420目录[-]Scikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集... 阅读全文
摘要:
reference :http://www.csdn.net/article/2012-12-28/2813275-Support-Vector-MachineSVM是什么?SVM是一种训练机器学习的算法,可以用于解决分类和回归问题,同时还使用了一种称之为kernel trick的技术进行数据的转换... 阅读全文
摘要:
refrence :http://cloga.info/python/2014/02/07/classify_use_Sklearn/加载数据集这里我使用pandas来加载数据集,数据集采用kaggle的titanic的数据集,下载train.csv。import pandas as pddf = ... 阅读全文
摘要:
reference:http://www.cnblogs.com/chaosimple/p/4153167.html一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,... 阅读全文
摘要:
reference :http://www.cnblogs.com/chaosimple/p/4153158.html关于缺失值(missing value)的处理在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。首先需要说明的是,nu... 阅读全文
摘要:
scikit-learn是一个用于机器学习的 Python 模块,建立在SciPy基础之上.主要特点:操作简单、高效的数据挖掘和数据分析无访问限制,在任何情况下可重新使用建立在NumPy、SciPy 和 matplotlib基础上使用商业开源协议——BSD许可证重要链接:官方源代码报告:https:... 阅读全文
摘要:
http://www.cnblogs.com/chaosimple/p/3227271.html数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性... 阅读全文