【sklearn第一讲】scikit-learn 简介
关于 scikit-learn
scikit-learn(简记sklearn),是用python实现的机器学习算法库。sklearn可以实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法。sklearn是基于NumPy, SciPy, matplotlib的。
NumPy python实现的开源科学计算包。它可以定义高维数组对象;矩阵计算和随机数生成等函数。
SciPy python实现的高级科学计算包。它和Numpy联系很密切,Scipy一般都是操控Numpy数组来进行科学计算,所以可以说是基于Numpy之上了。Scipy有很多子模块可以应对不同的应用,例如插值运算,优化算法、图像处理、数学统计等。
matplotlib python实现的作图包。使用matplotlib能够非常简单的可视化数据,仅需要几行代码,便可以生成直方图、功率谱、条形图、错误图、散点图等。
安装 scikit-learn
安装最新版本的sklearn的必要条件:
Python (>= 2.7 or >= 3.3)
NumPy (>= 1.8.2)
SciPy (>= 0.13.3)
如果已经安装过numpy和scipy, 最简单的办法是使用python包管理工具pip直接安装sklearn. 具体说,在命令提示符下输入
pip install -U scikit-learn
pip 是一个Python包管理工具,主要是用于安装 PyPI 上的软件包。如果你安装的Python 2 >=2.7.9 或者Python 3 >=3.4 python自带了pip,所以不用安装。
可以用 pip list命令查看安装了哪些python包。
如果还没有安装numpy或scipy, 同样可以在命令提示符下使用pip安装。
pip install numpy