经典的数据集汇总

名称 训练集 测试集 说明  
MNIST手写体数据集 60000张 10000张 10个类别,每张图片28*28 单标签、多分类
IMDB电影评论数据集

25000条评论

50%正

50%负

25000条评论

50%正

50%负

  二分类
 路透社数据集 8982个样本 2246个样本 

46个不同的新闻主题,训练集中每个主题都有至少10个样本

每个样本都是一个整数列表 

单标签、多分类

 波士顿房价数据集 404条  102条  506条样本,每个样本有13个特征,特征的取值范围可能不一样  回归

 猫狗图像数据集

2013年kaggle比赛

 自定义 自定义 

 12500张猫

 12500张狗

CNN

ImageNet数据集     

140万张标记图像,

1000个不同种类,包含许多动物类别,其中包含不同种类的猫和狗

CNN
 Glove词嵌入  400000个单词的100维嵌入向量  LSTM、RNN
 耶拿天气数据集      每10分钟记录14个不同的量(比如气温、气压、湿度、风向等)

LSTM

温度预测

 CelebA名人人脸数据集     超过20万张名人肖像  VAE
 CIFAR10数据集     50000张32*32的RGB图像,有10个类别,每个类别5000张图像 GAN
posted @   nxf_rabbit75  阅读(2040)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示