2024.9.13(周五)

完成机器学习查询数据集的作业

数据集名称样本数属性属性个数标签任务
Iris 数据集 150 花萼长度, 花萼宽度, 花瓣长度, 花瓣宽度 4 鸟类(Setosa, Versicolor, Virginica) 分类
MNIST 数据集 70,000 像素值(28x28像素) 784 手写数字(0-9) 分类
Titanic 数据集 891 乘客ID, 船舱等级, 姓名, 性别, 年龄, 登船港口, 票价, 亲属数量等 12 生还(0/1) 分类

详细说明:

  1. Iris 数据集

    • 样本数: 150
    • 属性: 包括花萼长度、花萼宽度、花瓣长度和花瓣宽度,共4个数值型属性。
    • 属性个数: 4
    • 标签: 数据集中的标签是鸢尾花的品种,有三种可能(Setosa, Versicolor, Virginica)。
    • 任务: 分类任务,通过花萼和花瓣的特征来预测花的品种。
  2. MNIST 数据集

    • 样本数: 70,000张训练图像和10,000张测试图像
    • 属性: 每张图像为28x28像素的灰度图像,共784个像素值。
    • 属性个数: 784
    • 标签: 每个图像的标签是手写数字(0到9)。
    • 任务: 分类任务,通过图像的像素值来预测数字。
  3. Titanic 数据集

    • 样本数: 891个乘客的记录
    • 属性: 包括乘客ID、船舱等级、姓名、性别、年龄、登船港口、票价、亲属数量等。
    • 属性个数: 12
    • 标签: 标签是乘客是否生还(0表示未生还,1表示生还)。
    • 任务: 分类任务,通过乘客的特征来预测其是否生还。
posted @ 2024-09-14 16:36  记得关月亮  阅读(5)  评论(0编辑  收藏  举报