第七次毕业设计博客
学习内容:
python实现图片的自动上色
整个网络的架构由两个大部分组成:第一部分是由低级特征提取网络、中级特征提取网络、融合层和上色网络组成;第二部分由低级特征提取网络、全局特征提取网络组成。其中低级特征提取网络共享卷积核的权重,图中两个低级特征提取网络的紫色tensor厚度是相同的,但宽和高却不一定相同。
其实关于低级、中级、全局特征提取网络的区分是很模糊的,只能通过网络的深度来做一个大概的判断。一般卷积网络随着深度增加,提取的特征维度就会越来越高,一般认为:边和角—>纹理—>全局特征。
网络的输入是灰度图,第一部分网络的输入是原图像大小的灰度图,第二部分网络的输入是reszie(就是结构图中第二部分网络输入的Scaling操作)成224*224后的灰度图。第一部分只包含了卷积,所以对输入图像的大小没有限制。而第一部分包含了全链接,因此对输入图像的大小有限制。
神经网络的预测过程就像这样:我们有一张灰度图的输入,我们希望以此来预测两个色彩图层,Lab 中的 a 和 b,它们一起构成了色相(Chrominance)。再将预测图层经过上采样成原图的大小,最终和输入的灰度图层 L (Luminance)一起组合成 Lab 图片。
网络其他细节:
- 网络的输入是多分辨率的。
- 网络中没有池化层,通过步长为2*2的卷积代替池化。
- 除了输出层的激活函数是sigmod,其他层的激活函数都使用了Relu。
- 网络中的上采样都采用了基于最近邻算法的reszie。
- 对模型来说训练集是十分重要的,如果训练集的图片种类较少,那么泛化能力必然不好。
参考网址:https://blog.csdn.net/u010030977/article/details/78846198