TiNO-Edit:基于扩散的稳健图像编辑的时间步长和噪声优化
TiNO-Edit:基于扩散的稳健图像编辑的时间步长和噪声优化
尽管有许多尝试利用预训练的文本到图像模型(T2I)(如稳定扩散(SD)),进行可控图像编辑,但产生良好的可预测结果仍然是一个挑战。以前的方法要么侧重于在特定数据集上,对预训练的T2I模型进行精细调优,以生成特定类型的图像(例如,使用特定的对象或人),要么侧重于优化每个输入图像的权重、文本提示和/或学习特征,以试图引导图像生成器产生所需的结果。然而,这些方法都有缺点,无法以可预测和可控的方式产生良好的结果。为了解决这个问题,提出了TiNO Edit,这是一种基于SD的方法,专注于在编辑过程中优化噪声模式和扩散时间步长,这是以前未探索过的。通过这个简单的更改,能够生成与原始图像更好地对齐,并重新实现所需结果的结果。此外,提出了一组新的损失函数,它们在SD的潜在域中运行,与在像素域中运行的先前损失相比,大大加快了优化速度。改进的方法可以很容易地应用于SD的变体,包括文本反转和DreamBooth,它们对新概念进行编码并将其合并到编辑结果中。展示了通过改进的方法实现的一系列图像编辑功能。
TiNO Edit启用的功能概述,如图4-37所示。

图4-37 TiNO Edit启用的功能概述
TiNO Edit提供各种图像编辑功能,可以与DreamBooth(DB)或文本反转(TI)一起运行。通过利用扩散时间步长和噪声优化技术,可以生成逼真和高质量的输出。
人工智能芯片与自动驾驶
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2023-12-18 激光雷达技术背后的科学启示
2021-12-18 IP 公司与GPU IP
2020-12-18 循环IRNNv2Layer实现
2020-12-18 2D池化IPoolingLayer
2020-12-18 TensorRT 7.2.1开发初步