CVPR 2023 Workshop | 首个大规模视频全景分割比赛
前言 本次比赛包含两个track,视频语义分割(VSS Track)与视频全景分割(VPS Track)。来源丨CVer
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
Workshop主页链接:
https://www.vspwdataset.com/Workshop%202023.html
简介:像素级视频理解是计算机视觉领域的一个基本任务。目前学界对图片分割己经有了比较充分的研究。然而对与现实世界的很多应用,比如自动驾驶、短视频编辑等等,需要处理的多为视频数据。因此,对视频分割的研究是必要且具有现实意义的。为此,主办方采集了目前最大规模的视频语义分割数据集 Video Scene Parsing in the Wild (VSPW) [1] 以及视频全景分割数据集VIdeo Panoptic Segmentation in the Wild (VIPSeg) [2],并在此基础上举办视频语义/全景分割比赛。比赛公开了VSPW与VIPSeg 数据集的训练集和验证集,而测试集的ground truth 不会公开。参赛者可以提交测试集预测结果到比赛网站上来获得模型测试结果。
同时我们也欢迎不限于此次比赛的相关学术论文投稿,研究topic 包括但不限于视频/图片语义分割(VSS),视频物体分割(VOS),视频实例分割(VIS),视频全景分割(VPS),目标跟踪(Tracking)以及其他视频相关应用,投稿cmt地址为:
https://www.vspwdataset.com/Workshop%202023.html.
截稿日期详见workshop主页:
https://www.vspwdataset.com/Workshop%202023.html.
本次比赛包含两个track,视频语义分割(VSS Track)与视频全景分割(VPS Track)。
视频语义分割赛道(VSS Track):在此赛道中,参赛者可以使用VSPW的训练集来训练模型。其他相关的分割数据集(COCO、ADE20k 等)也可以应用在训练中,如果应用了其他数据集,需要向主办方说明使用额外数据集的信息。排行榜根据分割结果与ground truth 的mIoU来决定。
参赛网站:
https://codalab.lisn.upsaclay.fr/competitions/7869
数据集下载:
https://github.com/VSPW-dataset/VSPW-dataset-download
Baseline代码:
https://github.com/VSPW-dataset/VSPW_baseline
视频全景分割赛道(VPS Track):在此赛道中,参赛者可以使用VIPSeg的训练集来训练模型。其他相关的分割数据集(COCO、ADE20k 等)也可以应用在训练中,如果应用了其他数据集,需要向主办方说明使用额外数据集的信息。排行榜根据VPQ score来决定。
参赛网站:
https://codalab.lisn.upsaclay.fr/competitions/9743
数据集下载:
https://github.com/VIPSeg-Dataset/VIPSeg-Dataset
Baseline 代码:
https://github.com/VIPSeg-Dataset/VIPSeg-Dataset/tree/main/ClipPanoFCN
比赛分为两个阶段:
第一阶段时间为1月20日至5月15日,参赛者可开发模型,提交测试集预测结果。本阶段返回部分测试集的预测结果。
第二阶段为 5月15日至5月25日,是比赛的最终阶段。
[1] VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021
[2] Large-scale Video Panoptic Segmentation in the Wild: A Benchmark. CVPR 2022
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
QQ交流群:444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。
模型部署交流群:732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。
其它文章
Rethinking Attention with Performers
用少于256KB内存实现边缘训练,开销不到PyTorch千分之一
DAMO-YOLO | 超越所有YOLO,兼顾模型速度与精度