刘悦的技术博客

2024年3月9日

苹果AppleMacOs系统Sonoma本地部署无内容审查(NSFW)大语言量化模型Causallm

摘要：

最近Mac系统在运行大语言模型（LLMs）方面的性能已经得到了显著提升，尤其是随着苹果M系列芯片的不断迭代，本次我们在最新的MacOs系统Sonoma中本地部署无内容审查大语言量化模型Causallm。这里推荐使用koboldcpp项目，它是由c++编写的kobold项目，而MacOS又是典型的U 阅读全文

posted @ 2024-03-09 13:02 刘悦的技术博客阅读(1106) 评论(0) 推荐(0)

2024年2月28日

无所不谈,百无禁忌,Win11本地部署无内容审查中文大语言模型CausalLM-14B

摘要：

目前流行的开源大语言模型大抵都会有内容审查机制，这并非是新鲜事，因为之前chat-gpt就曾经被“玩”坏过，如果没有内容审查，恶意用户可能通过精心设计的输入（prompt）来操纵LLM执行不当行为。内容审查可以帮助识别和过滤这些潜在的攻击，确保LLM按照既定的安全策略和道德标准运行。但我们今天讨论阅读全文

posted @ 2024-02-28 21:07 刘悦的技术博客阅读(4397) 评论(1) 推荐(5)

2024年2月22日

摘要：

苹果AppleMacOs最新Sonoma系统本地训练和推理GPT-SoVITS模型实践

GPT-SoVITS是少有的可以在MacOs系统下训练和推理的TTS项目，虽然在效率上没有办法和N卡设备相提并论，但终归是开发者在MacOs系统构建基于M系列芯片AI生态的第一步。环境搭建首先要确保本地环境已经安装好版本大于6.1的FFMPEG软件： (base) ➜ ~ ffmpeg -ver 阅读全文

posted @ 2024-02-22 10:26 刘悦的技术博客阅读(1040) 评论(0) 推荐(0)

2024年2月2日

自然语言开发AI应用,利用云雀大模型打造自己的专属AI机器人

摘要：

如今，大模型层出不穷，这为自然语言处理、计算机视觉、语音识别和其他领域的人工智能任务带来了重大的突破和进展。大模型通常指那些参数量庞大、层数深、拥有巨大的计算能力和数据训练集的模型。但不能不承认的是，普通人使用大模型还是有一定门槛的，首先大模型通常需要大量的计算资源才能进行训练和推理。这包括高性能阅读全文

posted @ 2024-02-02 11:54 刘悦的技术博客阅读(793) 评论(3) 推荐(0)

2024年1月29日

离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope

摘要：

制作双语字幕的方案网上有很多，林林总总，不一而足。制作双语字幕的原理也极其简单，无非就是人声背景音分离、语音转文字、文字翻译，最后就是字幕文件的合并，但美中不足之处这些环节中需要接口api的参与，比如翻译字幕，那么有没有一种彻底离线的解决方案？让普通人也能一键制作双语字幕，成就一个人的字幕组？人声阅读全文

posted @ 2024-01-29 10:46 刘悦的技术博客阅读(2010) 评论(2) 推荐(7)

2024年1月25日

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

摘要：

阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战，但实际上，Whisper的使用者完全可以针对中文的语音做一些优化的措施，换句话说，Whisper的“默认”形态可能在中文领域斗不过FunAsr，但是经过中文特殊优化的Whisper就未必了。中文文本标注优化 Whisper经常被阅读全文

posted @ 2024-01-25 14:22 刘悦的技术博客阅读(5118) 评论(0) 推荐(3)

2024年1月22日

龙蛇入笔,身不由己,码农出书以及无法控制的表达欲

摘要：

拙著《Tornado（龙卷风）编程实战》结集付梓，自惟庸陋，略為芹献，积年咳唾，不入方家，聊供诸君一哂。这本书以异步框架Tornado为基底，透过一个完整的项目阐释异步框架结合Vue.js如何实现一个低成本的前后端分离架构。项目内涉及的知识点涵括：Web3.0、数据库、设计模式落地、算法和数据结构阅读全文

posted @ 2024-01-22 12:31 刘悦的技术博客阅读(329) 评论(0) 推荐(6)

2024年1月15日

如何快速部署本地训练的 Bert-VITS2 语音模型到 Hugging Face

摘要：

Hugging Face是一个机器学习（ML）和数据科学平台和社区，帮助用户构建、部署和训练机器学习模型。它提供基础设施，用于在实时应用中演示、运行和部署人工智能（AI）。用户还可以浏览其他用户上传的模型和数据集。Hugging Face通常被称为机器学习界的GitHub，因为它让开发人员公开分享和阅读全文

posted @ 2024-01-15 09:17 刘悦的技术博客阅读(1119) 评论(0) 推荐(1)

2024年1月10日

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

摘要：

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型，它具有高阅读全文

posted @ 2024-01-10 17:16 刘悦的技术博客阅读(6148) 评论(3) 推荐(5)

2024年1月7日

如何在GitHub正确提PR(Pull Requests),给喜欢的开源项目贡献代码

摘要：

最好的中文TTS项目Bert-vits2更新了中文特化分支，但可能由于时间仓促，代码中存在不少的bug，作为普通用户，有的时候也想为自己喜欢的开源项目做一点点贡献，帮助作者修改一些简单的bug，那么该如何开始？本次我们以Bert-vits2项目为例子，分享正确提交PR(Pull Requests) 阅读全文

posted @ 2024-01-07 12:30 刘悦的技术博客阅读(670) 评论(0) 推荐(1)

刘悦的技术博客

公告