摘要: 2024-12-06,由浙江大学工业控制技术国家重点实验室联合杭州师范大学信息科学与工程学院以及香港科技大学的研究人员共同创建了一个多相机、多地图的视觉惯性定位系统数据集,该数据集通过提供长期、一致且无漂移的位置反馈,对机器人的自主导航和控制领域具有重要意义。 一、研究背景: 随着自主机器人技术的快 阅读全文
posted @ 2024-12-09 18:23 数据猎手小k 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 2024-12-06,由香港大学与腾讯PCG的ARC实验室联合创建了EgoPlan-Bench2数据集,这个数据集通过模拟人类日常生活中的复杂任务,为多模态大型语言模型(MLLMs)的规划能力提供了一个严格和全面的评估平台,对于推动人工智能向通用智能发展具有重要意义。 一、研究背景: 随着多模态大型 阅读全文
posted @ 2024-12-09 17:31 数据猎手小k 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 2024-12-03,由哈尔滨工业大学(深圳)的计算机科学系联合澳门大学、新加坡南洋理工大学等机构创建了EmoAva数据集,这是首个大规模、高质量的文本到3D表情映射数据集,对于推动情感丰富的3D头像生成技术的发展具有重要意义。 一、研究背景: 在人工智能领域,尤其是情感计算社区,生成能够反映人类面 阅读全文
posted @ 2024-12-05 16:20 数据猎手小k 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 2024-10-04, LLM360项目团队创建了TxT360数据集,这个数据集通过整合多种数据源,为预训练大型语言模型提供了丰富的训练材料,具有重要的研究和应用价值。 一、研究背景: 随着人工智能技术的发展,尤其是自然语言处理(NLP)领域的进步,预训练大型语言模型(LLM)已成为推动NLP技术发 阅读全文
posted @ 2024-12-05 11:43 数据猎手小k 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 2024-11-30 ,由Area-25团队开发的一个专门用于生成高质量网络内容数据集的Python库。该数据集旨在为大型语言模型(LLM)和人工智能应用的训练提供丰富的数据资源。 一、让我们一起来看一下WebRover WebRover通过智能网络爬虫技术,自动从网络中提取与特定主题相关的内容,并 阅读全文
posted @ 2024-12-04 15:04 数据猎手小k 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 2024-10-30,由Spawning台创建的Public Domain 12M(PD12M)数据集,包含了1240万张高质量的公共领域和CC0许可的图像及其合成标题,旨在训练文本到图像的模型。这个数据集不仅规模巨大,能够训练基础模型,同时最小化版权问题,还引入了社区驱动的数据治理机制,以减少伤害 阅读全文
posted @ 2024-12-04 14:13 数据猎手小k 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 2024-06-01,由谷歌 DeepMind 联手斯坦福大学等机构联合推出Open X-Embodiment Dataset。这是迄今为止最大的开源真实机器人数据集。它包含 100 多万条真实机器人轨迹,涵盖 22 个机器人实例,从单臂机器人到双手机器人和四足机器人。为机器人学习领域提供了一个全新 阅读全文
posted @ 2024-12-04 13:38 数据猎手小k 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 2024-11-29 ,由穆罕默德·本·扎耶德人工智能大学等机构创建了GEOBench-VLM数据集,目的评估视觉-语言模型(VLM)在地理空间任务中的表现。该数据集的推出填补了现有基准测试在地理空间应用中的空白,提供了超过10,000个经过人工验证的指令,推动了环境监测、城市规划和灾害管理等领域的 阅读全文
posted @ 2024-12-03 17:20 数据猎手小k 阅读(4) 评论(0) 推荐(0) 编辑
摘要: BioDeepAV:一个多模态基准数据集,包含超过1600个深度伪造视频,用于评估深度伪造检测器在面对未知生成器时的性能。 2024-11-29, 由罗马尼亚布加勒斯特大学创建BioDeepAV数据集,它专门设计来评估最先进的深度伪造检测器在面对未见过的深度伪造生成器时的泛化能力,这对于提高检测器的鲁棒性和适应性具有重要意义。 阅读全文
posted @ 2024-12-03 16:13 数据猎手小k 阅读(1) 评论(0) 推荐(0) 编辑
摘要: DriveMLLM:一个专为自动驾驶空间理解任务设计的大规模基准数据集,包含2734张前置摄像头图像,并引入了绝对和相对空间推理任务。 2024-11-20, 由武汉大学、中国科学院自动化研究所、悉尼科技大学、牛津大学等合创建了DriveMLLM数据集,该数据集是自动驾驶领域首个专为评估多模态大型语言模型(MLLMs)空间理解能力而设计的基准,对于推动自动驾驶技术的发展具有重要意义。 阅读全文
posted @ 2024-12-02 18:00 数据猎手小k 阅读(1) 评论(0) 推荐(0) 编辑