CVPR 2023 Workshop | 首个大规模视频全景分割比赛

前言本次比赛包含两个track，视频语义分割（VSS Track）与视频全景分割（VPS Track）。

来源丨CVer

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

Workshop主页链接：

https://www.vspwdataset.com/Workshop%202023.html

简介：像素级视频理解是计算机视觉领域的一个基本任务。目前学界对图片分割己经有了比较充分的研究。然而对与现实世界的很多应用，比如自动驾驶、短视频编辑等等，需要处理的多为视频数据。因此，对视频分割的研究是必要且具有现实意义的。为此，主办方采集了目前最大规模的视频语义分割数据集 Video Scene Parsing in the Wild (VSPW) [1] 以及视频全景分割数据集VIdeo Panoptic Segmentation in the Wild (VIPSeg) [2]，并在此基础上举办视频语义/全景分割比赛。比赛公开了VSPW与VIPSeg 数据集的训练集和验证集，而测试集的ground truth 不会公开。参赛者可以提交测试集预测结果到比赛网站上来获得模型测试结果。

同时我们也欢迎不限于此次比赛的相关学术论文投稿，研究topic 包括但不限于视频/图片语义分割(VSS)，视频物体分割（VOS），视频实例分割（VIS），视频全景分割（VPS），目标跟踪（Tracking）以及其他视频相关应用，投稿cmt地址为：

https://www.vspwdataset.com/Workshop%202023.html.

截稿日期详见workshop主页：

https://www.vspwdataset.com/Workshop%202023.html.

本次比赛包含两个track，视频语义分割（VSS Track）与视频全景分割（VPS Track）。

视频语义分割赛道（VSS Track）：在此赛道中，参赛者可以使用VSPW的训练集来训练模型。其他相关的分割数据集（COCO、ADE20k 等）也可以应用在训练中，如果应用了其他数据集，需要向主办方说明使用额外数据集的信息。排行榜根据分割结果与ground truth 的mIoU来决定。

参赛网站：

https://codalab.lisn.upsaclay.fr/competitions/7869

数据集下载：

https://github.com/VSPW-dataset/VSPW-dataset-download

Baseline代码：

https://github.com/VSPW-dataset/VSPW_baseline

视频全景分割赛道（VPS Track）：在此赛道中，参赛者可以使用VIPSeg的训练集来训练模型。其他相关的分割数据集（COCO、ADE20k 等）也可以应用在训练中，如果应用了其他数据集，需要向主办方说明使用额外数据集的信息。排行榜根据VPQ score来决定。

参赛网站：

https://codalab.lisn.upsaclay.fr/competitions/9743

数据集下载：

https://github.com/VIPSeg-Dataset/VIPSeg-Dataset

Baseline 代码：

https://github.com/VIPSeg-Dataset/VIPSeg-Dataset/tree/main/ClipPanoFCN

比赛分为两个阶段：

第一阶段时间为1月20日至5月15日，参赛者可开发模型，提交测试集预测结果。本阶段返回部分测试集的预测结果。

第二阶段为 5月15日至5月25日，是比赛的最终阶段。

[1] VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021

[2] Large-scale Video Panoptic Segmentation in the Wild: A Benchmark. CVPR 2022

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群：444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。

模型部署交流群：732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。

其它文章

Rethinking Attention with Performers

MobileDets：终端目标检测新标杆

U-Net在2022年相关研究的论文推荐

用少于256KB内存实现边缘训练，开销不到PyTorch千分之一

PyTorch 2.0 重磅发布：一行代码提速 30%

Hinton 最新研究：神经网络的未来是前向-前向算法

聊聊计算机视觉入门

FRNet：上下文感知的特征强化模块

DAMO-YOLO | 超越所有YOLO，兼顾模型速度与精度

《医学图像分割》综述，详述六大类100多个算法

如何高效实现矩阵乘？万文长字带你从CUDA初学者的角度入门

近似乘法对卷积神经网络的影响

BT-Unet:医学图像分割的自监督学习框架

语义分割该如何走下去？

轻量级模型设计与部署总结

从CVPR22出发，聊聊CAM是如何激活我们文章的热度！

入门必读系列（十六）经典CNN设计演变的关键总结：从VGGNet到EfficientNet

入门必读系列（十五）神经网络不work的原因总结

入门必读系列（十四）CV论文常见英语单词总结

入门必读系列（十三）高效阅读论文的方法

入门必读系列（十二）池化各要点与各方法总结

TensorRT教程（三）TensorRT的安装教程

TensorRT教程（一）初次介绍TensorRT

TensorRT教程（二）TensorRT进阶介绍

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的神经网络可视化工具与项目

计算机视觉中的transformer模型创新思路总结

计算机视觉中的传统特征提取方法总结

计算机视觉中的数据预处理与模型训练技巧总结

计算机视觉中的图像标注工具总结

计算机视觉中的数据增强方法总结

计算机视觉中的注意力机制技术总结

计算机视觉中的特征金字塔技术总结

计算机视觉中的池化技术总结

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的论文创新的常见思路总结

神经网络中的归一化方法总结

神经网络的初始化方法总结

posted @ 2023-02-11 15:01 CV技术指南（公众号）阅读(297) 评论(0) 编辑收藏举报

刷新页面返回顶部