CVPR 2023 Workshop | 首个大规模视频全景分割比赛

前言 本次比赛包含两个track,视频语义分割(VSS Track)与视频全景分割(VPS Track)。

来源丨CVer

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

 
Workshop主页链接:
https://www.vspwdataset.com/Workshop%202023.html

 

简介:像素级视频理解是计算机视觉领域的一个基本任务。目前学界对图片分割己经有了比较充分的研究。然而对与现实世界的很多应用,比如自动驾驶、短视频编辑等等,需要处理的多为视频数据。因此,对视频分割的研究是必要且具有现实意义的。为此,主办方采集了目前最大规模的视频语义分割数据集 Video Scene Parsing in the Wild (VSPW) [1] 以及视频全景分割数据集VIdeo Panoptic Segmentation in the Wild (VIPSeg) [2],并在此基础上举办视频语义/全景分割比赛。比赛公开了VSPW与VIPSeg 数据集的训练集和验证集,而测试集的ground truth 不会公开。参赛者可以提交测试集预测结果到比赛网站上来获得模型测试结果。

 

同时我们也欢迎不限于此次比赛的相关学术论文投稿,研究topic 包括但不限于视频/图片语义分割(VSS),视频物体分割(VOS),视频实例分割(VIS),视频全景分割(VPS),目标跟踪(Tracking)以及其他视频相关应用,投稿cmt地址为:
https://www.vspwdataset.com/Workshop%202023.html.
截稿日期详见workshop主页:
https://www.vspwdataset.com/Workshop%202023.html.

 

本次比赛包含两个track,视频语义分割(VSS Track)与视频全景分割(VPS Track)。

 

视频语义分割赛道(VSS Track):在此赛道中,参赛者可以使用VSPW的训练集来训练模型。其他相关的分割数据集(COCO、ADE20k 等)也可以应用在训练中,如果应用了其他数据集,需要向主办方说明使用额外数据集的信息。排行榜根据分割结果与ground truth 的mIoU来决定。

 

参赛网站:
https://codalab.lisn.upsaclay.fr/competitions/7869
数据集下载:
https://github.com/VSPW-dataset/VSPW-dataset-download
Baseline代码:
https://github.com/VSPW-dataset/VSPW_baseline

 

视频全景分割赛道(VPS Track):在此赛道中,参赛者可以使用VIPSeg的训练集来训练模型。其他相关的分割数据集(COCO、ADE20k 等)也可以应用在训练中,如果应用了其他数据集,需要向主办方说明使用额外数据集的信息。排行榜根据VPQ score来决定。
参赛网站:
https://codalab.lisn.upsaclay.fr/competitions/9743
数据集下载:
https://github.com/VIPSeg-Dataset/VIPSeg-Dataset
Baseline 代码:
https://github.com/VIPSeg-Dataset/VIPSeg-Dataset/tree/main/ClipPanoFCN

 

比赛分为两个阶段:
第一阶段时间为1月20日至5月15日,参赛者可开发模型,提交测试集预测结果。本阶段返回部分测试集的预测结果。
第二阶段为 5月15日至5月25日,是比赛的最终阶段。
 
[1] VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021
[2] Large-scale Video Panoptic Segmentation in the Wild: A Benchmark. CVPR 2022

 

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

 

 

QQ交流群:444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。

 

模型部署交流群:732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。

 

其它文章

Rethinking Attention with Performers

MobileDets:终端目标检测新标杆

U-Net在2022年相关研究的论文推荐

用少于256KB内存实现边缘训练,开销不到PyTorch千分之一

PyTorch 2.0 重磅发布:一行代码提速 30%

Hinton 最新研究:神经网络的未来是前向-前向算法

聊聊计算机视觉入门

FRNet:上下文感知的特征强化模块

DAMO-YOLO | 超越所有YOLO,兼顾模型速度与精度

《医学图像分割》综述,详述六大类100多个算法

如何高效实现矩阵乘?万文长字带你从CUDA初学者的角度入门

近似乘法对卷积神经网络的影响

BT-Unet:医学图像分割的自监督学习框架

语义分割该如何走下去?

轻量级模型设计与部署总结

从CVPR22出发,聊聊CAM是如何激活我们文章的热度!

入门必读系列(十六)经典CNN设计演变的关键总结:从VGGNet到EfficientNet

入门必读系列(十五)神经网络不work的原因总结

入门必读系列(十四)CV论文常见英语单词总结

入门必读系列(十三)高效阅读论文的方法

入门必读系列(十二)池化各要点与各方法总结

TensorRT教程(三)TensorRT的安装教程

TensorRT教程(一)初次介绍TensorRT

TensorRT教程(二)TensorRT进阶介绍

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的神经网络可视化工具与项目

计算机视觉中的transformer模型创新思路总结

计算机视觉中的传统特征提取方法总结

计算机视觉中的数据预处理与模型训练技巧总结

计算机视觉中的图像标注工具总结

计算机视觉中的数据增强方法总结

计算机视觉中的注意力机制技术总结

计算机视觉中的特征金字塔技术总结

计算机视觉中的池化技术总结

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的论文创新的常见思路总结

神经网络中的归一化方法总结

神经网络的初始化方法总结

 

 

posted @ 2023-02-11 15:01  CV技术指南(公众号)  阅读(297)  评论(0编辑  收藏  举报