三个数据集

数据集信息

1.

数据集名称

晴数智慧高质量大模型多轮对话SFT数据集

来源

https://opendatalab.com/MagicHub/LLM-SFT-Dataset

数据集描述

包含97184轮中文自然对话句子,涉及【家庭生活、教育医疗、军事战争、科学技术、气候环境、人文科学、商业经济、数码产品、体育竞技、休闲娱乐、衣食住行、艺术美术、政治法律、职业发展、宗教信仰】15个主题。

样本数(大小)

97184

属性个数

1

属性值取值范围

对话

标签数量

15

标签值\取值范围

家庭生活、教育医疗、军事战争、科学技术、气候环境、人文科学、商业经济、数码产品、体育竞技、休闲娱乐、衣食住行、艺术美术、政治法律、职业发展、宗教信仰

样本举例

某某对话(家庭生活)

面向任务

分类

             

 

2.

数据集名称

Fruits-360 数据集

来源

https://www.kaggle.com/datasets/moltean/fruits

数据集描述

包含 141 种水果、蔬菜和坚果的 94110 张图像的数据集

样本数(大小)

94110

属性个数

1

属性值取值范围

缩放为 100x100 像素的图像

标签数量

141

标签值\取值范围

苹果(不同品种:深雪、金、金红、青婆、粉红女士、红、红美味)、杏、鳄梨、鳄梨成熟、香蕉(黄色、红色、淑女手指)、甜菜根红、蓝莓、卷心菜、仙人掌果实、哈密瓜(2 个品种)、杨桃、胡萝卜、花椰菜、樱桃(不同品种,雷尼尔)、樱桃蜡(黄色、红色、黑色)、栗子、克莱门汀、椰子、 玉米(带壳)、黄瓜(成熟、常规)、枣、茄子、无花果、姜根、格兰纳迪拉、葡萄(蓝色、粉红色、白色(不同品种))、葡萄柚(粉红色、白色)、番石榴、榛子、越橘、猕猴桃、榛子、大头菜、金蹲、柠檬(正常、迈耶)、酸橙、荔枝、柑橘、芒果(绿色、红色)、芒果、马拉库亚、甜瓜 Piel de Sapo、桑葚、油桃(常规、扁平)、坚果(森林、山核桃)、洋葱(红色、白色)、橙子、木瓜、百香果、 桃子(不同品种)、Pepino、梨(不同品种,Abate、Forelle、Kaiser、Monster、Red、Stone、Williams)、辣椒(红色、绿色、橙色、黄色)、Physalis(正常,带壳)、菠萝(正常、迷你)、Pitahaya 红、李子(不同品种)、石榴、柚子甜心、土豆(红、甜、白)、木瓜、红毛丹、覆盆子、红醋栗、萨拉克、草莓(正常、楔形)、罗望子、橘子、番茄(不同品种、栗色、樱桃红、黄色、未成熟、 心形)、核桃、西瓜、西葫芦(绿色和深色)。

样本举例

苹果图像(标签: 苹果)

面向任务

分类

             

 

3.

数据集名称

1872 年至 2024 年的国际足球比赛结果

来源

https://www.kaggle.com/datasets/martj42/international-football-results-from-1872-to-2017

数据集描述

该数据集包括 47,126 场国际足球比赛的结果,从 1872 年的第一场正式比赛开始到 2024 年。比赛范围从 FIFA 世界杯到 FIFI Wild 杯再到常规友谊赛。这些比赛严格来说是男子国际比赛,数据不包括奥运会或至少一支球队是该国 B 队、U-23 或联赛精选球队的比赛。

样本数(大小)

47126

属性个数

7

属性值取值范围

- Date: 比赛日期 (YYYY-MM-DD)

- Home Team: 主队名称

- Away Team: 客队名称

- Home Goals: 主队进球数 (0-10)

- Away Goals: 客队进球数 (0-10)

- Tournament: 比赛类型

- City: 比赛城市

标签数量

3

标签值\取值范围

- Home Win

- Away Win

- Draw

样本举例

2022-06-01, Team A, Team B, 2, 1, Friendly, City A

面向任务

分类

             
posted @ 2024-09-30 08:52  涨涨涨张  阅读(4)  评论(0编辑  收藏  举报