随笔分类 - 图像风格迁移
摘要:在[2]中,我们从style transfer中使用的Gram matrix出发,试图解释为什么Gram matrix可以代表一个图片的style这个问题。这是我看完style transfer的paper后感觉最为迷惑的一点。一个偶然的机会,我们发现这个匹配两张图的Gram matrix,其实数学
阅读全文
摘要:离散余弦变换(DCT)是对实信号定义的一种变换,变换后在频域中得到的也是一个实信号,相比DFT而言,DCT可以减少一半以上的计算。 DCT还有一个很重要的性质(能量集中特性):大多书自然信号(声音、图像)的能量都集中在离散余弦变换后的低频部分,因而DCT在(声音、图像)数据压缩中得到了广泛的使用。
阅读全文
摘要:https://blog.csdn.net/wenqiwenqi123/article/details/105073639 https://blog.csdn.net/a19990412/article/details/84729453 1、在这篇论文当中,我们提出一个简单,但是有效的方法使得,第一
阅读全文
摘要:https://blog.csdn.net/qq_36356761/article/details/80306781
阅读全文
摘要:https://www.pianshen.com/article/2390348940/ 1.论文主要的思想分为三点:多种形式的解码器训练 + WCT层的风格融合 + 连贯的精细化处理。 [1]本文首先训练多个解码器,将图像输入预训练好的VGG网络,提取不同的relu_n层结果作为编码输出,针对co
阅读全文
摘要:1、Image super-resolution图像超分辨率 2、图像超分辨率重建技术分为两种,一种是从多张低分辨率图像合成一张高分辨率图像,另外一种是从单张低分辨率图像获取高分辨率图像 3、单幅图像超分辨率重建技术(SISR) 4、图像分辨率的含义: 图像分辨率指图像中存储的信息量,是每英寸图像内
阅读全文
摘要:1、提出了一种利用正交随机噪声矩阵对WCT的过程进行修改的方法,从而能够让风格迁移更具有多样性 方法 核心思想是在加入正交噪声矩阵丰富多样性的基础上,保证WCT过程中style纹理,也就是Gram矩阵不变。也就是说即使用正交噪声矩阵扰动前后feature map和原先不同了,但是Gram Matri
阅读全文
摘要:https://blog.csdn.net/zhangjunhit/article/details/70845704 1、本文使用深度卷积网络来进行 摄影风格转换,在 Neural Style algorithm [5] 的基础上进行改进的, 主要是在目标函数进行了修改,加了一项 Photoreal
阅读全文
摘要:1、创新点: 这篇论文实现了图像的任意风格转换,不在局限于单个风格的训练。同时支持优化和前向网络的方法。这个方面只在一层进行相关处理。 https://blog.csdn.net/wyl1987527/article/details/70476044
阅读全文
摘要:https://blog.csdn.net/yskyskyer123/article/details/98776657 https://blog.csdn.net/qq_44887206/article/details/105328233 作者利用照片和样式样本中出现的类似内容来了解样式如何改变内容
阅读全文
摘要:本文的核心思路如下: - 使用现成的识别网络,提取图像不同层级的特征。 - 低层次响应描述图像的风格,高层次响应描述图像的内容。 - 使用梯度下降方法,可以调整输入响应,在特定层次获得特定的响应。 - 多次迭代之后,输入响应即为特定风格和内容的图像。 本文介绍一个酷炫的深度学习应用:风格迁移。作者G
阅读全文
摘要:1、ResNet是一种残差网络,咱们可以把它理解为一个子网络,这个子网络经过堆叠可以构成一个很深的网络。 2、但是根据实验表明,随着网络的加深,优化效果反而越差,测试数据和训练数据的准确率反而降低了。这是由于网络的加深会造成梯度爆炸和梯度消失的问题。 目前针对这种现象已经有了解决的方法:对输入数据和
阅读全文
摘要:残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。 拟合:如果待定函数是线性,就叫线性拟合或者线性回归(主要在统计中),否则叫作非线性拟合或者非线性回归。表达式也可以是分段函数,这种情况下叫作样条拟合。 一组观测结果的数字统计与相应数值组的吻合。形象的说,拟合就是把平面上一系列的点,用一条光
阅读全文
摘要:1、我们的系统由两部分组成:一个图片转换网络fw 和一个损失网络 φ(用来定义一系列损失函数l1, l2, l3), 图片转换网络是一个深度残差网络,参数是权重W,它把输入的图片x通过映射 y=fw(x)转换成输出图片y, 每一个损失函数计算一个标量值li(y,yi), 衡量输出的y和目标图像yi之
阅读全文
摘要:交叉熵(Cross-Entropy) 交叉熵是一个在ML领域经常会被提到的名词。在这篇文章里将对这个概念进行详细的分析。 1.什么是信息量? 假设X的信息量为:I(x0)=−log(p(x0))时,熵将等于0,也就是说该事件的发生不会导致任何信息量的增加。举个例子,小明平时不爱学习,考试经常不及格,
阅读全文
摘要:https://blog.csdn.net/swinfans/article/details/88770119
阅读全文
摘要:tf.cast()函数的作用是执行 tensorflow 中张量数据类型转换,比如读入的图片如果是int8类型的,一般在要在训练前把图像的数据格式转换为float32。 cast(x, dtype, name=None) 第一个参数 x: 待转换的数据(张量) 第二个参数 dtype: 目标数据类型
阅读全文
摘要:argparse 是python自带的命令行参数解析包,可以用来方便地读取命令行参数。 它的使用也比较简单。 1.基本框架下面是采用argparse从命令行获取用户名,该python的文件名为:fun_test.py import argparse def main(): parser = argp
阅读全文