三个数据集
数据集信息
1.
数据集名称 |
晴数智慧高质量大模型多轮对话SFT数据集 |
|||||
来源 |
https://opendatalab.com/MagicHub/LLM-SFT-Dataset |
|||||
数据集描述 |
包含97184轮中文自然对话句子,涉及【家庭生活、教育医疗、军事战争、科学技术、气候环境、人文科学、商业经济、数码产品、体育竞技、休闲娱乐、衣食住行、艺术美术、政治法律、职业发展、宗教信仰】15个主题。 |
|||||
样本数(大小) |
97184 |
属性个数 |
1 |
属性值取值范围 |
对话 |
|
标签数量 |
15 |
标签值\取值范围 |
家庭生活、教育医疗、军事战争、科学技术、气候环境、人文科学、商业经济、数码产品、体育竞技、休闲娱乐、衣食住行、艺术美术、政治法律、职业发展、宗教信仰 |
|||
样本举例 |
某某对话(家庭生活) |
|||||
面向任务 |
分类 |
|||||
2.
数据集名称 |
Fruits-360 数据集 |
|||||
来源 |
https://www.kaggle.com/datasets/moltean/fruits |
|||||
数据集描述 |
包含 141 种水果、蔬菜和坚果的 94110 张图像的数据集 |
|||||
样本数(大小) |
94110 |
属性个数 |
1 |
属性值取值范围 |
缩放为 100x100 像素的图像 |
|
标签数量 |
141 |
标签值\取值范围 |
苹果(不同品种:深雪、金、金红、青婆、粉红女士、红、红美味)、杏、鳄梨、鳄梨成熟、香蕉(黄色、红色、淑女手指)、甜菜根红、蓝莓、卷心菜、仙人掌果实、哈密瓜(2 个品种)、杨桃、胡萝卜、花椰菜、樱桃(不同品种,雷尼尔)、樱桃蜡(黄色、红色、黑色)、栗子、克莱门汀、椰子、 玉米(带壳)、黄瓜(成熟、常规)、枣、茄子、无花果、姜根、格兰纳迪拉、葡萄(蓝色、粉红色、白色(不同品种))、葡萄柚(粉红色、白色)、番石榴、榛子、越橘、猕猴桃、榛子、大头菜、金蹲、柠檬(正常、迈耶)、酸橙、荔枝、柑橘、芒果(绿色、红色)、芒果、马拉库亚、甜瓜 Piel de Sapo、桑葚、油桃(常规、扁平)、坚果(森林、山核桃)、洋葱(红色、白色)、橙子、木瓜、百香果、 桃子(不同品种)、Pepino、梨(不同品种,Abate、Forelle、Kaiser、Monster、Red、Stone、Williams)、辣椒(红色、绿色、橙色、黄色)、Physalis(正常,带壳)、菠萝(正常、迷你)、Pitahaya 红、李子(不同品种)、石榴、柚子甜心、土豆(红、甜、白)、木瓜、红毛丹、覆盆子、红醋栗、萨拉克、草莓(正常、楔形)、罗望子、橘子、番茄(不同品种、栗色、樱桃红、黄色、未成熟、 心形)、核桃、西瓜、西葫芦(绿色和深色)。 |
|||
样本举例 |
苹果图像(标签: 苹果) |
|||||
面向任务 |
分类 |
|||||
3.
数据集名称 |
1872 年至 2024 年的国际足球比赛结果 |
|||||
来源 |
https://www.kaggle.com/datasets/martj42/international-football-results-from-1872-to-2017 |
|||||
数据集描述 |
该数据集包括 47,126 场国际足球比赛的结果,从 1872 年的第一场正式比赛开始到 2024 年。比赛范围从 FIFA 世界杯到 FIFI Wild 杯再到常规友谊赛。这些比赛严格来说是男子国际比赛,数据不包括奥运会或至少一支球队是该国 B 队、U-23 或联赛精选球队的比赛。 |
|||||
样本数(大小) |
47126 |
属性个数 |
7 |
属性值取值范围 |
- Date: 比赛日期 (YYYY-MM-DD) - Home Team: 主队名称 - Away Team: 客队名称 - Home Goals: 主队进球数 (0-10) - Away Goals: 客队进球数 (0-10) - Tournament: 比赛类型 - City: 比赛城市 |
|
标签数量 |
3 |
标签值\取值范围 |
- Home Win - Away Win - Draw |
|||
样本举例 |
2022-06-01, Team A, Team B, 2, 1, Friendly, City A |
|||||
面向任务 |
分类 |
|||||