sklearn 算法
sklearn 算法
基本
- classification 分类
- regression 回归
- clustering 聚类
- dimensionality reduction 降维
其他
- model selection 模型选择
- preprocessing 数据处理
一、分类 classification
- SVR 支持向量机
- nearest neighbors 最近临
- random forest 随机森林
应用:垃圾邮件分类,图像识别
二、回归 regression
- SVM 支持向量机
- ridge regression 岭回归
- Lasso
应用:药物反应,预测股价
三、聚类 clustering
- k-Means
- spectral clustering
- mean-shift
应用:客户细分,分组实验结果
四、降维 dimensionality reduction
- PCA 主成分分析
- feature selection 特征选择
- non-negative matrix factorization 非负矩阵分解
应用:可视化,提高效率
五、其他函数
- 模型选择 model selection
- 数据拆分 train_test_split
- 数据预处理/数据归一化
- 数据预处理/正则化
API
# 算法
from sklearn.linear_model import LinearRegression # 线性回归
from sklearn.linear_model import LogisticRegression # 逻辑回归
from sklearn.naive_bayes import GaussianNB # 高斯贝叶斯
from sklearn.tree import DecisionTreeClassifier # 决策树
from sklearn.svm import SVC # 支持向量机 SVM
from sklearn.neighbors import KNeighborsClassifier # KNN 最近邻
from sklearn.neural_network import MLPClassifier # 神经网络
# 工具
from sklearn.mode_selection import train_test_split # 数据处理
from sklearn import preprocessing # 数据拆分
参考: