第七次毕业设计博客

学习内容:

python实现图片的自动上色

 

整个网络的架构由两个大部分组成:第一部分是由低级特征提取网络、中级特征提取网络、融合层和上色网络组成;第二部分由低级特征提取网络、全局特征提取网络组成。其中低级特征提取网络共享卷积核的权重,图中两个低级特征提取网络的紫色tensor厚度是相同的,但宽和高却不一定相同。

 

其实关于低级、中级、全局特征提取网络的区分是很模糊的,只能通过网络的深度来做一个大概的判断。一般卷积网络随着深度增加,提取的特征维度就会越来越高,一般认为:边和角—>纹理—>全局特征。

 

网络的输入是灰度图,第一部分网络的输入是原图像大小的灰度图,第二部分网络的输入是reszie(就是结构图中第二部分网络输入的Scaling操作)成224*224后的灰度图。第一部分只包含了卷积,所以对输入图像的大小没有限制。而第一部分包含了全链接,因此对输入图像的大小有限制。

 

神经网络的预测过程就像这样:我们有一张灰度图的输入,我们希望以此来预测两个色彩图层,Lab 中的 a 和 b,它们一起构成了色相(Chrominance)。再将预测图层经过上采样成原图的大小,最终和输入的灰度图层 L (Luminance)一起组合成 Lab 图片。

网络其他细节:

  • 网络的输入是多分辨率的。
  • 网络中没有池化层,通过步长为2*2的卷积代替池化。
  • 除了输出层的激活函数是sigmod,其他层的激活函数都使用了Relu。
  • 网络中的上采样都采用了基于最近邻算法的reszie。
  • 对模型来说训练集是十分重要的,如果训练集的图片种类较少,那么泛化能力必然不好。

参考网址:https://blog.csdn.net/u010030977/article/details/78846198

 

posted @ 2020-02-07 16:16  胖虎ydy  阅读(107)  评论(0编辑  收藏  举报