刷新
神级辅助工具,解决GPT-SoVITS配音发音纠正和逐句优化

博主头像 即使地表最强AI配音也无法自动识别360应配音成三百六十还是三六零,在长文配音中很难一次满意,总会因为个别几句配音不理想而毁掉整个配音成果。 在GPT-SoVITS配音中,自动把长文章拆分成段落或长句子,让创作者可以精细地调节所有不满意的局部小段落配音,再自动合成回完整的音频。 由于GPT-SoVI ...

一个简洁易用的 DeepSeek 第三方开源客户端!

博主头像 大家好,我是 Java陈序员。 之前介绍一款开箱即用、支持多个大语言模型服务的桌面客户端。 开箱即用!一款支持多个大语言模型服务的桌面客户端! 今天,给大家安利一个简洁易用的 DeepSeek 第三方开源客户端! 关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算 ...

解密prompt系列52. 闲聊大模型还有什么值得探索的领域

博主头像 在DeepSeek-R1的开源狂欢之后,感觉不少朋友都陷入了**技术舒适区**,但其实当前的大模型技术只是跨进了应用阶段,可以探索的领域还有不少,所以这一章咱不聊论文了,偶尔不脚踏实地,单纯仰望天空,聊聊还有什么有趣值得探索的领域,哈哈有可能单纯是最近科幻小说看太多的产物~ ...

深度学习--个人总结

博主头像 学习与反思 主要是记录自己遇到的问题以及踩的坑 同时欢迎各位大佬,给我提出意见,我一定会好好吸取。_ 准确率只有0.1左右?(or 很低) 有可能是因为权重没有初始化(不一定是必要的) 或者学习率设置的问题,可能设置的太大了,试着调小一些 如何区分验证集和测试集? 训练集 (训练阶段) 用于构建我们 ...

semantic kernel调用ollama接口

博主头像 不积跬步无以至千里,不积小流无以成江海!--《荀子 劝学》 我是对本地大模型有执念的!因为它安全性好,数据完全被自己掌控。在前面的内容里面分享了如何使用OllamaSharp访问ollama接口,今天分享如何使用Semantic Kernel来访问ollama接口。 关于Semantic Kerne ...

武汉人工智能研究院 x Gitee:跨模态智能研发的革新之路

博主头像 武汉人工智能研究院(以下简称「武智院」,https://taichu-web.ia.ac.cn)是由武汉东湖新技术开发区重点建设的新型研发机构,聚焦跨模态智能国际前沿研究方向,作为中国科学院自动化研究所的核心创新平台,致力于推动人工智能技术的规模化应用与产业落地。 跨模态智能技术研发的挑战 跨模态智 ...

【保姆级教程】windows 安装 docker 全流程

博主头像 一、背景 许多小伙伴在安装 Dify 或是 RagFlow 这些工具的时候,往往会遇到一个难题,那就是 Docker 的安装。 首先,我们的PC安装的绝大部分是 Windows,但众所周知的原因,Windows 对 Docker 的支持并不是特别好,这方面的历史原因有很多,实际上 Docker 是 ...

【AI工具实战】一招解决英文视频困境,四步用AI搞定全中文字幕,你也可以!(文末附工具下载)

博主头像 “AI时代最大的红利,是让每个人都有机会成为那个"想到就能做到"的创造者。” AI粉嫩特攻队,2025年4月5日。 故事源于一个我想看的国外视频。本想点开视频准备大饱眼福,结果发现全程英文演讲加英文字幕...而我那三脚猫的英语听力跟不上视频的节奏。 放弃还是继续,这是一个问题。好在痛点一般会让我热情 ...

抄了AI语音克隆的家!本地部署、6G显存搞定、一键启动包免费放送

博主头像 今天给大家带来几款AI语音克隆技术的硬核分享,包括本地部署教程,还有超方便的一键启动整合包。无论你是技术小白还是资深玩家,这篇干货都能让你轻松上手,克隆出属于自己的专属语音! 1. Index-TTS:语音克隆界的“省心王者” 在AI语音克隆圈子里,Index-TTS绝对是“懒人福音”。它强不强?我 ...

渠道商的AI掘金革命——零门槛代理千亿级市场,打造未来增长极

博主头像 渠道商的AI掘金革命——零门槛代理千亿级市场,打造未来增长极渠道商的生死抉择——代理AI,还是被时代抛弃?当传统软件代理利润缩水至5%、客户频繁追问“能否做AI功能”时,渠道商正站在历史拐点:①继续代理ERP、CRM等“过气产品”?——利润持续走低,客户流失加速。②转型AI赛道?——技术门槛高、投入 ...

开发一个mcp-server实现sqlite智能体

博主头像 mcp介绍 MCP(Model Context Protocol)是由 Anthropic(Claude的那个公司) 推出的开放标准协议,它为开发者提供了一个强大的工具,能够在数据源和 AI 驱动工具之间建立安全的双向连接。 举个好理解的例子:如果把 AI 比作电脑主机,那么 MCP 就相当于 US ...

一套低成本、高质量的替代AI数字人/唇形同步方案

博主头像 随着自媒体和电商的蓬勃发展,AI技术正成为内容创作和营销的新宠。最近,我身边一位做自媒体的朋友为了推广店铺,接触到了一家新媒体公司。这家公司推出了一款小程序,宣称只需上传一段真人朗读数字(如“12345...”)的视频,就能根据文案生成AI克隆声音并实现唇形同步的视频。听起来是不是很酷?当你还在一天 ...

Open R1 项目进展第二期

博主头像 我们启动 Open R1 项目 已经两周了,这个项目是为了把 DeepSeek R1 缺失的部分补齐,特别是训练流程和合成数据。 这篇文章里,我们很高兴跟大家分享一个大成果: OpenR1-Math-220k,这是我们打造的第一个大规模数学推理数据集! 除此之外,我们还聊聊社区里一些让人兴奋的进展, ...

DeepSeek 会话补全 API

博主头像 DeepSeek 会话补全 API 是一个超强大的 AI 对话接口 ,可以让你:- 打造自己的 智能聊天机器人 - 让 AI 帮你 写文章、改代码、编故事 - 甚至模拟 各种角色(比如猫娘、霸道总裁、科幻作家…) ...

<1···202122···29>