VideoChat笔记

https://arxiv.org/pdf/2305.06355.pdf

一个理解视频的大语言模型, 跟视频里面内容可以随便问模型. 还是老方法直接第三章走起.

3. VideoChat:

   直接看图: 

  VideoChat分2个部分, 一个是VideoChat-Text 一个是VideoChatEmbed
  VideoChat-Text 是 把视频里面内容转化为文字.


posted on 2023-09-21 16:36  张博的博客  阅读(111)  评论(0编辑  收藏  举报

导航