摘要: 其实现原理非常像之前学的图像压缩的兄弟——视频压缩: VAE Encoder(变分视频压缩,将其压缩到低维的隐空间中降低计算量) 借用Google DeepMind的NaViT (2023.07) 支持了原始比例和分辨率,从而使其采样灵活并提高取景构图能力。 Transform Diffusion 阅读全文
posted @ 2024-02-28 16:12 浪矢-CL 阅读(16) 评论(0) 推荐(0) 编辑