10 2024 档案
摘要:2024-10-28,为科学文档中的实体和关系抽取领域带来了突破,提供了一个包含106篇完整科学出版物、超过24,000个实体和12,000个关系的大规模数据集,这对于构建科学知识图谱和促进科学信息抽取技术的发展具有重要意义。 一、研究背景: 在科学文档中,实体(如数据集、方法、任务)和它们之间的关
阅读全文
摘要:2024-10-28,由英国林肯大学工程与物理科学学院创建SPOTS-10,数据集主要解决夜间图像中基于动物独特体纹识别的复杂计算机视觉任务,为机器学习算法提供了宝贵的评估资源。 一、研究背景: 动物模式识别,如条纹、斑点或其他标记,在夜间图像中识别动物是一项复杂的计算机视觉任务,对于野生动物研究、
阅读全文
摘要:2024-09-24,由麻省理工学院、微软、丰田研究院、NVIDIA联合发布的 Faces in Things,为我们打开了研究人类视觉错觉——尤其是面部错觉(Pareidolia)的新篇章。专注于人类视觉系统如何在各种随机刺激中检测到类似面孔的结构,例如在咖啡污渍或天空中的云朵中看到面孔。 一、背
阅读全文
摘要:2024-09-06,由伦敦南岸大学和帕多瓦大学联合发布的CISCA,是一个基于深度学习进行细胞实例分割和分类的新型方法。这项研究不仅提出了一个创新的网络架构,还引入了一个新的公开数据集CytoDArk0,为组织病理学图像分析提供了新的视角。 一、背景: 细胞实例分割与分类 在医学和生物学研究中,从
阅读全文
摘要:2024-10-15,由北京智源人工智能研究院、北京交通大学、北京邮电大学等机构联合创建了Infinity-MM,一个包含4000万个样本的大规模多模态指令数据集。这个数据集通过严格的质量过滤和去重,显著提升了开源模型与闭源模型性能的差距,为开源视觉语言模型的发展带来了重要意义。 一、研究背景: 近
阅读全文
摘要:2024-08-15,由斯坦福大学发布的Continuous Perception Benchmark(CPB),一个推动视频模型模仿人类连续感知能力的新基准。 一、背景: 视频理解的重要性 在计算机视觉领域,视频理解一直是一个基础而富有挑战的任务,它对于从监控到自动驾驶等多个领域都至关重要。 现有
阅读全文
摘要:2024-09-19, 由Google 和 Harvard University 联合发布的FRAMES,一个综合评估数据集,目的评估 LLMs 在统一框架中跨多个文档检索和推理的能力。 一、背景: 大型语言模型 (LLMs) 在各种认知任务中表现出显著的性能改进。一个新兴的应用程序正在使用 LLM
阅读全文
摘要:2024-09-25,由BMW集团和奥格斯堡大学联合创建GeoBiked数据集,以在工程设计中启用深度生成模型(DGM),并提出了通过利用大规模基础模型自动化数据标注的方法。 一、背景 快速发展的机器学习领域强调了高质量数据集在推动技术突破中的关键作用。在计算机视觉中,高质量、公开可用的数据集引入起
阅读全文
摘要:2024-09-27 ,由爱荷华州立大学创建FlowBench。这是一个大规模的流体动力学模拟数据集,目的推动复杂几何形状下流动物理学的机器学习模型的发展和评估。 一、研究背景 在航空航天、汽车制造、环境工程等领域,流体动力学的准确模拟对于设计和性能有着直接的影响。然而,传统的模拟方法成本高昂,需要
阅读全文
摘要:2024-10-24,由南洋理工大学和苏黎世联邦理工学院共同创建W-Bench,这是一个全面的基准测试,旨在评估水印方法对于包括图像再生、全局编辑、局部编辑和图像到视频生成在内的广泛图像编辑技术的鲁棒性。这个数据集的创建对于版权保护和知识产权的维护具有重要意义,尤其是在面对由大规模文本到图像模型驱动
阅读全文
摘要:2024-10-24,由中国科学院自动化研究所与字节跳动公司合作创建了ChatSearch,这一数据集通过多轮对话上下文来检索图像,极大地推动了开放领域内对话式图像检索技术的发展。 一、研究背景: 在人工智能领域,图像检索技术已经从基于内容的搜索发展到了更加自然和直观的对话式交互。这种对话式图像检索
阅读全文
摘要:2024-10-23,由浙江大学软件技术学院和中国科学院深圳先进技术研究院等联合创建OVT-B,这个数据集的规模和多样性为开放词汇多目标跟踪(OVMOT)研究开辟了新的道路。 一、研究背景: 在人工智能领域,开放词汇目标感知正成为一个重要议题,旨在识别在训练期间未见过的新类别对象。尽管在单张图像中的
阅读全文
摘要:2024-09-19,由北京人工智能研究院(BAAI)创建的CCI3.0-HQ数据集,是一个通过新颖的两阶段混合过滤流程显著提升数据质量的高质量子集。这个数据集的意义在于,它不仅提高了数据的纯净度,还通过实验表明,使用该数据集训练的模型在多个基准测试中取得了优于现有中文数据集的性能,为中文语言模型的
阅读全文
摘要:2024-10-24,由上海人工智能实验室联合多所高校创建了MMScan,这是迄今为止最大的多模态3D场景数据集,包含了层次化的语言标注。数据集的建立,不仅推动了3D场景理解的研究进展,还为训练和评估多模态3D感知模型提供了宝贵的资源。 一、研究背景: 随着大型语言模型(LLMs)的兴起和与其他数据
阅读全文
摘要:2024-10-09,由捷克布尔诺理工大学的研究人员创建了Diffusion Deepfake Speech,一个基于扩散模型的深度伪造语音数据集,对于评估和改进现有的深度伪造检测系统具有重要意义。 一、研究背景: 随着人工智能和机器学习技术的进步,合成语音生成技术已经变得足够先进,以至于能够欺骗系
阅读全文
摘要:2024-10-10,北京大学联合多个机构和企业创建了Omni-MATH数据集,是一个大型语言模型在奥林匹克数学竞赛级别的数学推理能力进行评估的综合基准。这个数据集的创建意味着我们有了更严格的工具来测试和提高模型在解决复杂数学问题上的性能。 一、研究背景: 随着大型语言模型在数学推理能力上的显著进步
阅读全文
摘要:2024-04-22,由美国中佛罗里达大学计算机视觉研究中心创建了BC-MRI-SEG,这是基于公开可用的MRI数据集的二元乳腺癌肿瘤分割的基准。这个数据集的创建,不仅为医学影像社区提供了易于访问的四个公共乳腺癌MRI数据集,还通过比较最先进的深度学习方法,为临床设置中的稳健和适应性强的模型提供了评
阅读全文
摘要:2024-10-15,由阿里巴巴集团联合中国科学院大学和滑铁卢大学提出了一个创新的大型语言模型(LLMs)多粒度工具使用基准测试数据集——MTU-Bench。这个数据集的重要意义在于它通过模拟真实世界中的工具使用场景,提供了一个全面的评估框架,能够细致地衡量和提升LLMs在多轮对话和多工具使用场景下
阅读全文
摘要:2024-10-23,由新加坡国立大学和卡内基梅隆大学的研究团队等提出了一种新的数据集蒸馏方法EDF(Emphasize Discriminative Features),它通过Grad-CAM激活图增强合成图像中的关键判别区域,以提高在复杂场景下的性能。这一方法的意义在于,它能够显著提升在如Ima
阅读全文
摘要:2024-10-21,由西北工业大学、西安联丰声学技术有限公司、南洋理工大学、萨里大学和中国科学院声学研究所创建了AudioSetCaps数据集,包含190万对来自AudioSet录音的音频-字幕对。这个数据集在音频-文本检索和自动音频字幕两项下游任务上展现了卓越的性能,证明了其生成字幕的高质量。值
阅读全文
摘要:2024-10-03,由中国科学院自动化研究所创建的VideoCube数据集,探索如何使计算机视觉任务在目标跟踪方面更加接近人类的能力。这个数据集的意义在于提供了一个高质量、大规模的基准测试平台,能够模拟真实世界的复杂环境,为衡量和提升目标跟踪算法的智能水平提供了重要的科学评估工具。 一、研究背景:
阅读全文
摘要:2024-09-30,由多伦多大学航天与地面自主机器人系统实验室(STARS)与多伦多机器人与人工智能实验室(TRAIL)联合MDA太空公司,共同创建了ALLO(Anomaly Localization in Lunar Orbit)数据集。这个数据集填补了月球轨道空间操作异常检测领域的空白,为机器
阅读全文
摘要:2024-10-21,由西班牙庞培法布拉大学的研究团队创建的Curated Comparative Dataset,目的通过机器学习模型自动识别和分类这些视觉主题,对艺术历史和视觉文化领域的研究人员以及艺术家和内容创作者具有重要意义。 一、研究背景: 在电影艺术中,视觉主题是具有艺术或美学意义的反复
阅读全文
摘要:2024-10-21,由清华大学人工智能产业研究院(AIR)提出的Bench4Merge数据集,目的通过大规模数据集训练的车辆模型来增强评估自动驾驶车辆在高密度交通中合并场景的复杂性和多样性,为自动驾驶领域提供了一个更为真实和全面的评估工具。 一、研究背景: 随着自动驾驶技术的发展,自动驾驶车辆在高
阅读全文
摘要:2024-10-19,由德国Helmholtz慕尼黑研究中心的团队创建的MultiOrg数据集,是专门针对目标检测任务而设计的,包含了超过400张高分辨率的2D显微镜图像和超过60,000个类器官的标注,特别地,它包含了由两位专家在不同时间点独立标注的三组测试数据标签,为量化标注不确定性提供了新的视
阅读全文
摘要:2024-10-19,由北京航空航天大学创建的Acti,数据集通过整合和标注大量网络安全报告,为研究人员提供了一个宝贵的资源,以实现主动安全防御。 一、研究背景: 随着自动驾驶技术的发展,车辆网络安全问题日益凸显。黑客攻击、数据泄露等网络安全威胁对自动驾驶车辆的安全运行构成了严重挑战。为了有效应对这
阅读全文
摘要:2024-10-18,由西安交通大学和圣母大学的研究人员提出了MultiChartQA,一个新的基准数据集,目的评估多模态大型语言模型(MLLMs)在处理多图表问题时的能力。这个数据集的创建填补了现有基准测试在多图表场景下的空白,对于推动MLLMs在实际应用中的多图表理解能力具有重要意义。 一、研究
阅读全文
摘要:2024-10-19,由伊利诺伊大学厄巴纳-香槟分校和香港城市大学的研究团队提出了一种创新方法,通过将常规视频转换成伪标记的多摄像机视角推荐数据集,有效解决了在未知领域中模型泛化能力差的问题。数据集的创建,为电影、电视和其他媒体制作中的摄像机选择提供了有力的辅助,显著提高了模型在目标领域的准确性,实
阅读全文
摘要:2024-10-10,由浙江大学和阿里巴巴集团联合创建的WORFBENCH,一个用于评估大型语言模型(LLMs)生成工作流能力的基准测试。它包含了一系列的测试和评估协议,用于量化和分析LLMs在处理复杂任务时分解问题和规划执行步骤的能力。WORFBENCH 通过模拟多种应用场景和复杂的图结构工作流,
阅读全文
摘要:2024-10-10,由电信研究所、里斯本大学等联合创建MT-Pref数据集,它包含18种语言方向的18k实例,覆盖了2022年后的多个领域文本。通过在WMT23和FLORES基准测试上的实验,我们展示了使用MT-Pref数据集对Tower模型进行对齐可以显著提高翻译质量。 一、研究背景: 大型语言
阅读全文
摘要:2023-04-12,由加拿大滑铁卢大学的视觉和图像处理实验室创建了Cancer-Net BCa-S数据集,提供了一种基于合成相关扩散成像(CDIs)的深度学习方法来预测乳腺癌的Scarff-Bloom-Richardson(SBR)分级,从而避免了传统活检带来的压力和成本。 一、研究背景: 乳腺癌
阅读全文
摘要:2024-10-16,由华东师范大学和松鼠AI联合创建了FoundTS数据集,是一个全面覆盖多个领域的多变量时间序列数据集合,目的为时间序列预测模型提供一个标准化和综合性的评估基准。 一、研究背景: 时序预测(TSF)在金融、气象服务、能源管理等多个领域中扮演着关键角色。尽管当前出现了许多TSF方法
阅读全文
摘要:2024-10-08,由香港科技大学的计算机科学与工程系创建了PreCT-160K,这是迄今为止最大规模的医学图像预训练数据集。该数据集包含了160K个CT体积,覆盖了100多种解剖结构,对于推动医学图像分析领域的发展具有重要意义,特别是在标签效率和模型泛化能力方面。 一、研究背景: 在医学图像分析
阅读全文
摘要:2024-10-15,由威斯康星大学麦迪逊分校、微软研究院雷德蒙德等机构联合创建了TemporalBench,它通过大约10K个视频问答对,提供了一个独特的测试平台,用以评估各种时间理解和推理能力,如动作频率、运动幅度、事件顺序等。 一、研究背景: 在多模态视频理解和生成领域,细粒度的时间动态理解至
阅读全文
摘要:2024-10-12,由Gray Swan AI和UK AI Safety Institute共同创建了AgentHarm,这是一个开创性的基准测试,目的衡量大型语言模型(LLM)代理执行有害任务的倾向和能力。这个数据集不仅覆盖了广泛的恶意任务类别,而且还特别设计了模型在遭受攻击后仍能保持执行多步骤
阅读全文
摘要:2024-10-12,在药物发现领域,Insitro公司创建了KinDEL,一个针对两个激酶靶点(MAPK14和DDR1)的大规模、公开可用的DNA编码库数据集。这个数据集不仅推动了计算技术的发展,还通过不同的机器学习技术,为识别潜在药物提供了预测模型,具有重要的科研和临床意义。 一、研究背景: D
阅读全文
摘要:2024-09-30,由中国人民解放军陆军工程大学、南开大学、南京邮电大学和南京理工大学的研究人员联合创建了HazyDet数据集,目的解决无人机在恶劣天气条件下的环境感知问题。这个数据集的推出,极大地填补了相关基准测试的空白,为无人机目标检测技术的发展和评估提供了宝贵的资源。 一、研究背景: 随着无
阅读全文
摘要:2024-09-24,由中国山东计算机科学中心、北京大学等机构联合创建了Pests and Diseases Tree(PDT)数据集,目的解决农业领域中病虫害检测模型开发中专业数据集缺失的问题。通过集成公共数据和网络数据,进一步推出了Common Weed and Crop数据集,目的增强模型的分
阅读全文
摘要:2024-10-11,由Mila – Quebec AI Institute和McGill University等机构创建了首个大规模油井检测数据集,这个数据集的意义在于提供了一个工具,能够通过卫星图像识别和定位全球数以百万计的废弃油气井,这对于减少温室气体排放和保护环境具有重大意义。 一、研究背景
阅读全文
摘要:2024-10-10,由德国NCT/UCC Dresden、DKFZ Heidelberg等机构联合创建Multi-class Surgical Anatomy Dataset,通过使用解剖学感知的扩散模型,有效地解决了在生成过程中保持器官结构和纹理的挑战,为手术场景的语义分割和其他下游任务提供了宝
阅读全文
摘要:2024-10-03, 英国诺丁汉大学数学科学学院的Gary R. Mirams教授团队创建了一个基于英国地形的二维优化基准数据集,该数据集包含了经过修改的英国地形数据,并从中识别出了957,174个局部最优解,为优化算法的评估提供了新的视角。 一、研究背景: 在优化算法领域,真实世界的复杂性一直是
阅读全文
摘要:2024-10-10,由北京航空航天大学人工智能研究所、香港中文大学MMLab以及感知与交互智能中心共同创建了OpenUAV数据集,首个专为现实无人机(UAV)视觉语言导航(VLN)任务设计的大型轨迹数据集,该数据集通过模拟真实环境和飞行动态,为无人机导航研究提供了重要的资源和挑战。 一、研究背景:
阅读全文
摘要:2024-09-01 ,在蛋白质结构研究领域,复旦大学的研究团队创建了Dynamic PDB数据集,这是一种新的数据集 Dynamic PDB,目的在捕获蛋白质的动态行为,以及一套全面的物理特性,例如原子速度和力、势能和动能以及模拟环境的温度。弥补了传统静态蛋白质数据库的不足,为深入理解蛋白质的动态
阅读全文
摘要:2024-10-08,由法国尼斯大学CNRS、Inria、I3S以及西班牙巴斯克大学HiTZ中心的研究人员们创建了首个多语言医疗问答数据集CasiMedicos-Arg,在医学领域,AI系统的决策不仅需要准确,还需要能够被医生和患者理解。该数据集其中包含正确和错误的诊断结果,并由医生提供自然语言解释
阅读全文
摘要:2024-10-08,由哈尔滨工业大学(深圳)和清华大学深圳国际研究生院的研究人员联合创建的MIBench,作为首个模型反演攻击和防御的实用基准测试,不仅集成了16种最先进的攻击和防御方法,还提供了9种常用评估协议,为标准化和公平的评估分析提供了便利。MIBench的建立,目的通过全面比较和分析不同
阅读全文
摘要:2024-10-07,由意大利博洛尼亚大学经济系创建 EA-MD-QD 的大型数据集,数据集涵盖了欧元区及其十个主要成员国的季度和月度宏观经济时间序列数据。EA-MD-QD 的创建为宏观经济研究提供了宝贵资源,使其成为分析欧元区经济结果和政策分析的重要工具。 一、研究背景 近年来,随着“数据革命”的
阅读全文
摘要:2024-06-12 ,由上海人工智能实验室、哈尔滨工业大学、南京大学、复旦大学等联合创建OmniCorpus,一个达到百亿级别的图文交错数据集。它不仅规模空前,更以其多元化的数据来源和高质量的数据内容,为多模态大语言模型的研究提供了坚实的数据基础。 一、研究背景: 随着互联网数据的爆炸性增长,如何
阅读全文
摘要:2024-09-29 ,NeurIPS发布首个面向专业人士的大型语言模型图分析数据集GraphPro。这是首个目的测试和提升LLMs在图分析任务上表现的基准。该数据集的创建不仅填补了现有基准测试的空白,还为LLMs在图分析领域的应用提供了新的视角。 一、研究背景: 图分析在多个领域中都扮演着至关重要
阅读全文
摘要:2024-08-30,由京东健康、华中科技大学和浙江大学联合收集的第一个真实家庭环境中的多模态数据集MHAD,包含不同拍摄角度和各种家庭场景。它包含了迄今为止最全面的生理信号,是计算机视觉、机器学习和生物医学工程等多个学术研究领域的宝贵资源。 一、研究背景: 在家庭环境中实现非接触式生理监测,对于健
阅读全文
摘要:2024-06-12,在遥感图像领域,由武汉大学等机构联合创建的STAR数据集,标志着场景图生成技术在大规模、高分辨率卫星图像中的新突破。 一、研究背景: 场景图生成(Scene Graph Generation, SGG)技术在自然图像中已取得显著进展,但在高分辨率的卫星图像(Satellite
阅读全文
摘要:2024-08-30,由于利希超级计算中心 创建JUPITER Benchmark Suite,这是一个全面的 23 个基准测试程序集合,经过精心记录和设计,目的支持购买欧洲第一台百万兆次级超级计算机 JUPITER。 一、研究背景: 随着E级超级计算机时代的到来,HPC领域正经历一场革命。在这个时
阅读全文
浙公网安备 33010602011771号