经典的数据集汇总
分类:
Keras
名称 | 训练集 | 测试集 | 说明 | |
MNIST手写体数据集 | 60000张 | 10000张 | 10个类别,每张图片28*28 | 单标签、多分类 |
IMDB电影评论数据集 |
25000条评论 50%正 50%负 |
25000条评论 50%正 50%负 |
二分类 | |
路透社数据集 | 8982个样本 | 2246个样本 |
46个不同的新闻主题,训练集中每个主题都有至少10个样本 每个样本都是一个整数列表 |
单标签、多分类 |
波士顿房价数据集 | 404条 | 102条 | 506条样本,每个样本有13个特征,特征的取值范围可能不一样 | 回归 |
猫狗图像数据集 2013年kaggle比赛 |
自定义 | 自定义 |
12500张猫 12500张狗 |
CNN |
ImageNet数据集 |
140万张标记图像, 1000个不同种类,包含许多动物类别,其中包含不同种类的猫和狗 |
CNN | ||
Glove词嵌入 400000个单词的100维嵌入向量 | LSTM、RNN | |||
耶拿天气数据集 | 每10分钟记录14个不同的量(比如气温、气压、湿度、风向等) |
LSTM 温度预测 |
||
CelebA名人人脸数据集 | 超过20万张名人肖像 | VAE | ||
CIFAR10数据集 | 50000张32*32的RGB图像,有10个类别,每个类别5000张图像 | GAN |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 按钮权限的设计及实现