深度视频压缩的任务感知编码器控制

深度视频压缩的任务感知编码器控制

先前对机器任务的深度视频压缩（DVC）的研究，通常需要为每个特定任务训练一个唯一的编解码器，并要求每个任务都有一个专用的解码器。相比之下，传统的视频编解码器采用灵活的编码器控制器，通过模式预测等机制使单个编解码器能够适应不同的任务。从中汲取灵感，介绍了一种用于机器深度视频压缩的创新编码器控制器。该控制器具有模式预测和图片组（GoP）选择模块。改进的方法在编码阶段集中控制，允许在不同任务（如检测和跟踪）之间进行自适应编码器调整，同时保持与标准预训练DVC解码器的兼容性。经验证据表明，改进的方法适用于具有各种现有预训练DVC的多个任务。此外，大量的实验表明，在只有一个预训练解码器的情况下，改进的方法在不同任务中的比特率比之前的DVC高出约25%。

深度视频压缩的任务感知编码器控制框架，如图4-21所示。

图4-21 深度视频压缩的任务感知编码器控制框架

在图4-21中，（a）机器控制DVC框架概述。给定一个输入GoP，首先使用GoP选择网络来预测GoP结构，然后预测的结构控制编码过程，对机器视觉任务的输入帧进行编码。（b）0元素控制编码器使用DVMP。（c）GoP选择网络，包括预分析阶段和GoP预测阶段。

posted @ 2024-12-01 18:40 吴建明wujianming 阅读(18) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 异构计算与Transformer综述

· 2021 年音视频技术与发展

· 一文搞懂视频编解码原理

· 技术分享| 探索视频感知编码

· 视频编解码介绍

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

历史上的今天：
2023-12-01 图形渲染操作系统分析
2022-12-01 自动泊车-RISC-V-飞桨生态分析
2021-12-01 2021年8-10月AI融资方向分析
2020-12-01 deepstream-开放式实时服务器
2020-12-01 GStreamer 1.0 series序列示例
2020-12-01 H265与ffmpeg改进开发
2020-12-01 FFmpeg扩展开发

公告

昵称：吴建明wujianming
园龄： 7年5个月
粉丝： 532
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:云计算服务器技术市场分析
Super Pi linux工具可以提供下吗？网上包括官方的都没法在centos、ubuntu os下跑，

xuxu8511@163.com 多谢。
--xu111122
2. Re:RISC-V指令列表分析
jalr中的14到12位应该为000而不是010吧
--洛天V
3. Re:《LLVM编译器原理与实践》新书推荐（已出版）
已买，学习中，支持博主
--tieyan
4. Re:NPU与超异构计算杂谈
好文章，很详细的对异构做了Overview！感谢大佬🫡
--kaiZH
5. Re:《LLVM编译器原理与实践》新书推荐（已出版）
这本书中对于LLVM垃圾回收机制statepoint有做研究吗？或者博主有推荐的资料吗？官网的资料确实比较晦涩难懂而且没有案例。
--wingrez