Fork me on GitHub

微软开源的 AI 工具,让旧照片焕发新生

原文地址:Bringing Old Photos Back to Life
原文作者:Ziyu Wan
译者 & 校正:HelloGitHub-小鱼干 & 鸭鸭

写在前面

在 GitHub 热点趋势 Vol.046 中,HG 介绍过一个微软开源的 AI 工具——Bringing-Old-Photos-Back-to-Life,它可以让破损、残旧的图片焕发新生,在本周更是获得近 3k star。而本文则是项目团队成员 Ziyu Wan 发布于 Hacker News 的项目介绍,Enjoy it~

概述

我们打算通过深度学习的方法来修复老化严重的旧照片。与传统的监督式学习 supervised learning 的修复任务不同,真实照片的老化更为复杂,合成图像和真实旧照片之间的领域差距 domain gap 使得网络无法泛化。因此,我们提出了一种利用真实照片和大量合成图像对的新型三重域翻译网络。具体来说,我们训练了两个变分自编码器 (VAE),分别将旧照片和干净照片转换为两个潜在空间。通过合成配对数据来学习两个潜在空间之间的转换。因为在紧凑的潜在空间中,domain gap 是封闭的,所以这种翻译网络可以很好地泛化为真实照片。

此外,为了解决混杂在旧照片中的多个退化问题,我们设计了一个带有 partial nonlocal block 的全局分支,用于处理结构性缺陷,如:划痕、尘点,和一个局部分支,用于处理非结构性缺陷,如:噪点、模糊。两个分支在潜在空间融合,提高从多个退化问题中恢复旧照片的能力。该方法在相片修复的视觉质量方面优于现有的方法。

架构全览

  1. 我们首先训练两个变分自编码器 VAE: VAE1 用于真实照片 r ∈ R 和合成图像 x ∈ X,通过联合训练一个对抗判别器缩小它们的 domain gap;对干净图像 y ∈ Y 进行 VAE2 训练。利用 VAE 将图像转换到紧凑的潜在空间。
  2. 我们了解了在紧凑潜在空间将损坏的图像恢复到带 partial non-local block 的干净照片的映射。

对比图

更多修复细节

近距离围观

团队成员 Ziyu Wan 对 Bringing-Old-Photos-Back-to-Life 的介绍已经翻译完毕,感兴趣的小伙伴可以去把玩下,项目地址:

https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life

最后,欢迎优秀的你加入 HelloGitHub 的「译文亦舞」系列,让你的才华舞动起来!把优秀的文章分享给更多的人。要求:

  • 平时浏览 GitHub、开源、编程、程序员等英文资讯和文章
  • 想把自己阅读到优秀的英文文章分享给更多的人
  • 翻译准确但不是直翻或机翻
  • 保证每月至少翻译或校正 1 篇高质量文章
  • 了解 Markdown 和排版规则
  • 联系微信:xueweihan (备注:翻译)
posted @   削微寒  阅读(2316)  评论(1编辑  收藏  举报
编辑推荐:
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
阅读排行:
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 上周热点回顾(2.17-2.23)
点击右上角即可分享
微信分享提示