sklearn数据集的导入及划分

鸢尾花数据集的导入及查看：

①鸢尾花数据集的导入：

from sklearn.datasets import load_iris

②查看鸢尾花数据集：

iris=load_iris()
print("鸢尾花数据集：\n",iris)
print("查看数据集描述：\n", iris.DESCR)
print("查看特征值的名字：\n",iris.feature_names)
print("查看特征数据：\n",iris.data,iris.data.shape)
print("查看目标值名字：\n",iris.target_names)
print("查看目标数据：\n",iris.target)

划分数据集：

①导入train_test_split包：

from sklearn.model_selection import train_test_split

②划分数据集：数据集划分为训练集和测试集

x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)

注：iris.data为数据集的特征值，iris.target为数据集的目标值，test_size为测试值的划分比例（可省，默认为0.25），

　　x_train:训练集的特征值

　　x_test:测试集的特征值

　　y_train:训练集的目标值

　　y_test:测试集的特征值

完整代码：

from sklearn.datasets import load_iris     #导入数据集
from sklearn.model_selection import train_test_split

def datatest():
    # 获取数据集
    iris=load_iris()
    print("鸢尾花数据集：\n",iris)
    print("查看数据集描述：\n", iris.DESCR)
    print("查看特征值的名字：\n",iris.feature_names)
    print("查看特征数据：\n",iris.data,iris.data.shape)
    print("查看目标值名字：\n",iris.target_names)
    print("查看目标数据：\n",iris.target)

    # 划分数据集
    x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)
    print(x_train,x_train.shape)
    print(x_test,x_test.shape)
    print(y_train,y_train.shape)
    print(y_test,y_test.shape)
if __name__ == '__main__':
    datatest()

__EOF__

本文作者：CherriesOvO
本文链接：https://www.cnblogs.com/zyj3955/p/15414382.html
关于博主：评论和私信会在第一时间回复。或者直接私信我。
版权声明：本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主：如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力！

posted @ 2021-10-16 15:55 CherriesOvO 阅读(846) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

sklearn数据集的导入及划分

发表于 2021-10-16 15:55阅读次数：846评论次数：0

机器学习

关注

跳至底部

昵称： CherriesOvO
园龄： 4年8个月
粉丝： 40
关注： 4

+加关注

薛定谔的猫

sklearn数据集的导入及划分

鸢尾花数据集的导入及查看：

划分数据集：

完整代码：

公告

CherriesOvO

sklearn数据集的导入及划分

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论