论文理解Universal Style Transfer via Feature Transforms

https://www.pianshen.com/article/2390348940/

1.论文主要的思想分为三点:多种形式的解码器训练 + WCT层的风格融合 + 连贯的精细化处理。          

          [1]本文首先训练多个解码器,将图像输入预训练好的VGG网络,提取不同的relu_n层结果作为编码输出,针对conv层结果训练Decoder进行解码,从而针对不同的relu1….relu5层设计出多个解码器,来对VGG卷积层结果进行还原。          

          [2]WCT层分为白化和上色两部操作,白化操作会使用式子从原图中提取出原图的内容形式,上色操作会将风格图的风格和内容形式进行拼合组成新的结果(有特定的计算式子,无需训练)。        

         [3]经过上面的两点可以得到中图的 编码-WCT-解码的结构,但是该怎么选取编码的relu层是个问题,不同的conv层各有其特点,因此为了有好的效果,设计出右侧的精细化处理流程,先粗后细。

posted @   Tomorrow1126  阅读(516)  评论(0编辑  收藏  举报
编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· 单线程的Redis速度为什么快?
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
点击右上角即可分享
微信分享提示