摘要: 揭秘 FineVideo 数据集构建的背后的秘密 开放视频数据集稀缺,因此减缓了开源视频 AI 的发展。为此,我们构建了 FineVideo,这是一个包含 43,000 个视频的数据集,总时长为 3,400 小时,并带有丰富的描述、叙事细节、场景分割和问答对。 FineVideo 包含高度多样化的视频和元数据集合,使其成为训练模型理解视频内容、训练 阅读全文
posted @ 2024-10-13 09:25 HuggingFace 阅读(196) 评论(0) 推荐(1) 编辑