python库sklearn中的一些函数（更新ing...）

sklearn是python的重要机器学习库，其中封装了大量的机器学习算法，如：分类、回归、降维以及聚类；还包含了监督学习、非监督学习、数据变换三大模块。sklearn拥有完善的文档，使得它具有了上手容易的优势；它内置了大量的数据集，节省了获取和整理数据集的时间。因而，使其成为了广泛应用的重要的机器学习库。

学习连接：http://www.cnblogs.com/lianyingteng/p/7811126.html

下面是自己用到的一些函数：

1. train_test_split

　　这个函数是用来将总的数据集划分为训练集和测试集的

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=4)

参数：

　　1. X - 特征集

　　2. y - 标签集

　　3. 0-1之前表示的测试集占比，整数的话表示测试集样本数

　　4. 随机数种子，为1的话表示每次产生随机数一样

2. to_categorical(y, num_classes=None, dtype='float32')

　　将整形标签转为onehot

Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

　　参数：

　　1. int数组

　　2. 标签类别总数

posted @ 2018-12-25 12:10 Freddy520 阅读(1249) 评论(0) 编辑收藏举报

刷新页面返回顶部

Heart_M

python库sklearn中的一些函数（更新ing...）

公告