ComfyUI进阶:Comfyroll插件 (六)前言:学习ComfyUI是一场持久战,而Comfyroll 是一款功能强大的自定义节点集合,专为 ComfyUI 用户打造,旨在提供更加丰富和专业的图像生成与编辑工具。借助这些节点,用户可以在静态图像的精细调整和动态动画的复杂构建方面进行深入探索。C ...
简介 由于 AMD 官方没有提供 Debian12 的驱动和 ROCM,只好安装 Ubuntu20.04 的驱动和 ROCM,必要软件 git 和 python3-venv。 添加 i386 仓库 sudo dpkg --add-architecture i386 && \ sudo apt upg ...
TooBox也盒 v0.2.0版本上线,支持图片批量裁剪。 在进行 Lora 训练时,通常需要这三种尺寸,但有时我们的素材并不符合这些规格,这时就需要进行裁剪。 首先启动 TooBox也盒,选择“图片裁剪”功能,然后选择包含待裁剪图片的文件夹。选定文件夹后,图片显示区域将展示该文件夹中的所有图片。通 ...
1. 人工大脑 1.1. 语言学习模型 1.1.1. 1986年,美国心理学家大卫·鲁梅尔哈特(David Rumelhart)和詹姆斯·麦克莱兰(James McClelland)提出了一个语言学习模型 1.1.2. 它学习语言的方式无异于儿童 1.2. 科学家们没有教系统任何规则,而是让计算机自 ...
AI绘画中,要想绘制出自己想要的固定的角色或风格,常用的方法是自己训练模型。训练模型需要向模型训练程序输入原始的图片,并告诉它每张图片中包含哪些信息。为每张图片搭配描述该图片有哪些信息的过程为“打标”。通常是在图片同一目录下创建一个与图片同名的.txt文件。文件中以逗号分隔开描述图片的英文词汇。但是 ...
前置知识 Activation 激活指的是一些在fp时计算得到的临时tensor, 会用于bp时的计算. 如果能在fp计算后把临时tensor缓存下来就可以加速bp, 缺点在于激活会占用大量显存. 以一层transformer结构为例分析下各层存在的激活. 简单部分的分析这里忽略. 主要分析下几个不 ...
ComfyUI进阶:Comfyroll插件 (五)前言:学习ComfyUI是一场持久战,而Comfyroll 是一款功能强大的自定义节点集合,专为 ComfyUI 用户打造,旨在提供更加丰富和专业的图像生成与编辑工具。借助这些节点,用户可以在静态图像的精细调整和动态动画的复杂构建方面进行深入探索。C ...
一、CloseAI介绍 CloseAI是一家企业级的OpenAI服务代理商,主要面向被OpenAI限制地区的企业用户提供API代理服务。可以提供远超OpenAI账号限额的大规模并发调用,广泛被用于AI产品开发、数据处理、科学研究等领域。 我一般是随时用随时充值,按需充值,到账很快,几乎不需要等待。 ...
CosyVoice是一个大规模预训练语言模型,深度融合文本理解和语音生成的一项新型语音合成技术,能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音 CosyVoice采用了总共超15万小时的数据训练,依托先进的大模型技术进行特征提取,从而完成声音的复刻,用户无需训练过程,仅需提供时长较短 ...
前置知识 MOE(MixerOfExpert) moe的主要原理是替换attention层后的MLP层, 通过将不同类型的token按照门控单元计算出的概率分配给最大概率处理的专家网络处理, 对比单一MLP更适合处理复杂多样化的数据集. 主要思想和集成学习感觉很像, 而且扩展性(遇到新的目标任务可以 ...
1. 20世纪30年代 1.1. 库尔特·哥德尔(KurtGödel) 1.1.1. 用完备性定理(completeness theorem)和不完备性定理(incompleteness theorems)证明了逻辑的全部能力及其局限性 1.1.2. 复杂算法的基本逻辑目录就被创建出来了,而随之诞生 ...
本教程详细介绍了 LoRA 参数高效微调技术,包括数据集准备和处理、模型加载、参数设置等,然后以 Qwen2-0.5B 预训练模型实践,进行了文本分类能力微调,微调过程通过 SwanLab 可视化界面查看,最终微调模型进行测试数据评估…… ...
ComfyUI进阶:Comfyroll插件 (四)前言:学习ComfyUI是一场持久战,而Comfyroll 是一款功能强大的自定义节点集合,专为 ComfyUI 用户打造,旨在提供更加丰富和专业的图像生成与编辑工具。借助这些节点,用户可以在静态图像的精细调整和动态动画的复杂构建方面进行深入探索。C ...
背景: 1.介绍FL 2.介绍NAS(讨论范围限制在CNN) 宏搜索空间覆盖整个CNN模型,例如,隐藏层的数量n、操作类型(例如,卷积)和快捷连接的链接方法 微观搜索空间仅覆盖整个模型结构中重复的基序或细胞。并且这些单元在复杂的多分支操作中构建 介绍RT(强化学习)在NAS中的运用,因为RT要模拟采 ...
毕业即就业,从校园象牙塔一脚踏入未知的职场,新手程序员们的迷茫和忐忑在所难免。华为云AI原生应用引擎来为你的职场首秀加点“码力”,简单四步,带你体验无需编写一行代码,即可拥有个性化AI助手的奇妙之旅。 ...
论文提出了CachedAttention,一种新的注意力机制允许在多轮对话中重用KV Cache,显著减少重复计算开销从而提升推理性能。 ...
1. 基本信息 读AI新生:破解人机共存密码 斯图尔特·罗素 著 中信出版社,2020年8月出版 1.1. 读薄率 书籍总字数301千字,笔记总字数44614字。 读薄率44614÷301000≈14.8% 1.2. 读厚方向 千脑智能 脑机穿越 未来呼啸而来 虚拟人 AI3.0 新机器人 人工不智 ...
前言: 学习ComfyUI是一场持久战,而Comfyroll 是一款功能强大的自定义节点集合,专为 ComfyUI 用户打造,旨在提供更加丰富和专业的图像生成与编辑工具。借助这些节点,用户可以在静态图像的精细调整和动态动画的复杂构建方面进行深入探索。Comfyroll 的节点设计简洁易用,功能强大, ...
1. 识别、洞察、行动 1.1. 当你不知道该做什么时,智力就是你需要使用的东西。 1.1.1. [瑞士]让·皮亚杰(Jean Piaget),生物学家和发展心理学家 1.2. 对于人类来说很难的事情,对机器来说很简单。 1.2.1. 因为从可控硬件中学习数据的软件已经越来越熟练地掌握了识别、洞察和 ...
最近好久没有写博客了,浅浅记录下如何将OpenAI-Whisper做成Web服务吧 介绍 在这篇指导性博客中,我们将探讨如何在Python中结合使用FastAPI和OpenAI-Whisper。OpenAI-Whisper是一个前沿的语音识别模型,而FastAPI是一个高性能的现代Web框架,专 ...