摘要: CLIP(Contrastive Language-Image Pre-training)是一种机器学习技术,它可以准确理解和分类图像和自然语言文本,这对图像和语言处理具有深远的影响,并且已经被用作流行的扩散模型DALL-E的底层机制。在这篇文章中,我们将介绍如何调整CLIP来辅助视频搜索。 这篇文 阅读全文
posted @ 2022-12-31 09:48 deephub 阅读(74) 评论(0) 推荐(0) 编辑