10 2023 档案

摘要:栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。 BERT的核心思想是通过在大规模文本语料上进行无监督预训 阅读全文
posted @ 2023-10-23 15:48 刘悦的技术博客 阅读(3216) 评论(0) 推荐(5) 编辑
摘要:铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)视频以及图片修复技术是一项具有挑战性的AI视觉任务,它涉及在视频或者图片序列中填补缺失或损坏的区域,同时保持空间和时间的连贯性。该技术在视频补全、对象移除、视频恢复等领域有广泛应用。近年来,两种突出的方案在视频修复中崭露头角:flow-based propagation和spatiotemporal 阅读全文
posted @ 2023-10-13 12:58 刘悦的技术博客 阅读(1057) 评论(0) 推荐(1) 编辑
摘要:AIGC革新,将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)很多平台都会禁止用户使用带有网址或者二维码的头像以及文章配图,这样可以有效的防止用户的一些“导流”行为。当然,头像、文章或者视频现在都是AI来审,毕竟现在人工的成本实在太高,但是如果我们把文字元素直接融入图像或者视频之中,如此一来,AI也会很难识别出一些“导流”的元素。 本次我们依靠PIKA-lab 阅读全文
posted @ 2023-10-07 12:14 刘悦的技术博客 阅读(539) 评论(1) 推荐(1) 编辑

点击右上角即可分享
微信分享提示