09 2024 档案

炸裂！新版 SD WebUI Forge 出图速度更快！支持最新Flux 模型！（保姆级安装教程）

摘要：大家是不是经常为SD WebUI卡顿、爆显存而苦恼?一启动SD 电脑就开始发烫，尤其低显存用户屡屡"中招",不得不一遍遍重启。作为AI绘画的必备工具，WebUI却还有这么多"坑"，着实让人不爽!😠 好消息是，WebUI作者张吕敏博士也发现了这个问题，终于推出了升级版 SD WebUI Forge 阅读全文

posted @ 2024-09-10 22:49 贾维斯Echo 阅读(10324) 评论(1) 推荐(0) 编辑

AI证件照，抠图、换背景、任意尺寸...有了这个神器,证件照通通自己搞定（本地化部署教程）

摘要：最近有个Github开源的AI证件照神器火了,以后再也不用专门跑一趟照相馆拍证件照了! 你随手一张日常生活照或自拍,上传到它那里,分分钟就能帮你换上。蓝底、白底,抠掉杂乱的背景,生成各种尺寸规格的证件照。这款名叫HivisionIDPhotos的开源工具,它不仅能帮你便捷地制作出免冠白底照、蓝底阅读全文

posted @ 2024-09-07 00:02 贾维斯Echo 阅读(944) 评论(0) 推荐(1) 编辑

AI超强语音转文本SenseVoice，本地化部署教程！

摘要：模型介绍 SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别：采用超过40万小时数据训练，支持超过50种语言，识别效果上优于Whisper模型。富文本识别：具备优秀的情感识别，能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力，支持音乐阅读全文

posted @ 2024-09-04 23:30 贾维斯Echo 阅读(5993) 评论(0) 推荐(1) 编辑

阿里重磅开源Qwen2-VL：超越人类的视觉理解能力，从医学影像到手写识别，这款开源多模态大模型究竟有多强？（附本地化部署教程）

摘要：阿里重磅开源Qwen2-VL：超越人类的视觉理解能力，从医学影像到手写识别，这款开源多模态大模型究竟有多强？（附本地化部署教程）模型介绍最近呢，阿里巴巴开源了Qwen2-VL，在多模态大模型展现了在实际应用中的巨大潜力,尤其是在处理跨模态数据方面表现出众。以下是该模型的几大应用亮点: 智能客服新阅读全文

posted @ 2024-09-03 23:11 贾维斯Echo 阅读(1573) 评论(0) 推荐(1) 编辑

公告

昵称：贾维斯Echo 园龄：4年5个月粉丝：67 关注：30

昵称：贾维斯Echo
园龄： 4年5个月
粉丝： 67
关注： 30

+加关注

2025年3月

日

一

二

三

四

五

六

贾维斯Echo的博客园

个人学习笔记

09 2024 档案

公告

搜索

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜