上一页 1 2 3 4 5 6 7 8 ··· 27 下一页
摘要: 本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴) 按照固有思维方式,深度学习的训练环节应该在云端,毕竟本地硬件条件有限。但事实上,在语音识别和自然语言处理层面,即使相对较少的数据量也可以训练出高性能的模型,对于预算有限的同学们来说,也没必要花冤枉钱上“云端”了,本次我们来演示如何在本地训练Bert-VITS2 V2.0.2模型。 阅读全文
posted @ 2023-11-22 15:42 刘悦的技术博客 阅读(1471) 评论(3) 推荐(6) 编辑
摘要: 又欲又撩人,基于新版Bert-vits2V2.0.2音色模型雷电将军八重神子一键推理整合包分享 Bert-vits2项目近期炸裂更新,放出了v2.0.2版本的代码,修正了存在于2.0先前版本的重大bug,并且重炼了底模,本次更新是即1.1.1版本后最重大的更新,支持了三语言训练及混合合成,并且做到向下兼容,可以推理老版本的模型,本次我们基于新版V2.0.2来本地推理原神小姐姐们的音色模型。 具 阅读全文
posted @ 2023-11-20 11:26 刘悦的技术博客 阅读(1446) 评论(2) 推荐(7) 编辑
摘要: 一键整合,万用万灵,Python3.10项目嵌入式一键整合包的制作(Embed) 我们知道Python是一门解释型语言,项目运行时需要依赖Python解释器,并且有时候需要安装项目中对应的三方依赖库。对于专业的Python开发者来说,可以直接通过pip命令进行安装即可。但是如果是分发给其他的Windows用户,特别是不熟悉Python的人来说,这样过于繁琐。因此最好的办法是连同Python解释器和Python项目打包在一起,通过嵌入式一键整合包解决项目的分发问题。 本次我们以[一键扒谱的项目](https://v3u.cn/a_id_327)为例子,演示如何将项目直接打包为一键整合包,方便其他用户运行使用。 阅读全文
posted @ 2023-11-16 18:15 刘悦的技术博客 阅读(847) 评论(2) 推荐(3) 编辑
摘要: 不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10) 所谓"扒谱"是指通过听歌或观看演奏视频等方式,逐步分析和还原音乐作品的曲谱或乐谱的过程。它是音乐学习和演奏的一种常见方法,通常由音乐爱好者、乐手或学生使用。 在扒谱的过程中,人们会仔细聆听音乐作品,辨别和记录出各个音符、和弦、节奏等元素,并通过试错和反复推敲来逐渐还原出准确的曲谱或乐谱。这对于那些没 阅读全文
posted @ 2023-11-15 16:16 刘悦的技术博客 阅读(1003) 评论(6) 推荐(3) 编辑
摘要: AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10) 懂乐理的音乐专业人士可以通过写乐谱并通过乐器演奏来展示他们的音乐创意和构思,但不识谱的素人如果也想跨界玩儿音乐,那么门槛儿就有点高了。但随着人工智能技术的快速迭代,现在任何一个人都可以成为“创作型歌手”,即自主创作并且让AI进行演唱,极大地降低了音乐制作的门槛。 本次我们基于PaddleHub和Di 阅读全文
posted @ 2023-11-14 15:05 刘悦的技术博客 阅读(506) 评论(0) 推荐(2) 编辑
摘要: 持续进化,快速转录,Faster-Whisper对视频进行双语字幕转录实践(Python3.10) Faster-Whisper是Whisper开源后的第三方进化版本,它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等,从而减少了计算量和内存消耗,提高了推理速度,与此同时,Faster-Whisper也改进了推理算法、优化计算过程、减少冗余计算等,用以提高模型的运行效率。 本次我们利用Faster-Whisper对日语视频进行双语(日语/国语)转录实践,看看效率如何。 阅读全文
posted @ 2023-11-03 14:15 刘悦的技术博客 阅读(3870) 评论(0) 推荐(5) 编辑
摘要: 栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10) 诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。 BERT的核心思想是通过在大规模文本语料上进行无监督预训 阅读全文
posted @ 2023-10-23 15:48 刘悦的技术博客 阅读(3007) 评论(0) 推荐(5) 编辑
摘要: 铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10) 视频以及图片修复技术是一项具有挑战性的AI视觉任务,它涉及在视频或者图片序列中填补缺失或损坏的区域,同时保持空间和时间的连贯性。该技术在视频补全、对象移除、视频恢复等领域有广泛应用。近年来,两种突出的方案在视频修复中崭露头角:flow-based propagation和spatiotemporal 阅读全文
posted @ 2023-10-13 12:58 刘悦的技术博客 阅读(850) 评论(0) 推荐(1) 编辑
摘要: AIGC革新,将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10) 很多平台都会禁止用户使用带有网址或者二维码的头像以及文章配图,这样可以有效的防止用户的一些“导流”行为。当然,头像、文章或者视频现在都是AI来审,毕竟现在人工的成本实在太高,但是如果我们把文字元素直接融入图像或者视频之中,如此一来,AI也会很难识别出一些“导流”的元素。 本次我们依靠PIKA-lab 阅读全文
posted @ 2023-10-07 12:14 刘悦的技术博客 阅读(465) 评论(1) 推荐(1) 编辑
摘要: 基于TOTP算法的Github两步验证2FA(双因子)机制Python3.10实现 从今年(2023)三月份开始,Github开始强制用户开启两步验证2FA(双因子)登录验证,毫无疑问,是出于安全层面的考虑,毕竟Github账号一旦被盗,所有代码仓库都会毁于一旦,关于双因子登录的必要性请参见:别让你的服务器(vps)沦为肉鸡(ssh暴力破解),密钥验证、双向因子登录值得拥有。 双因 阅读全文
posted @ 2023-09-29 13:57 刘悦的技术博客 阅读(619) 评论(1) 推荐(3) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 27 下一页