ML多GPU训练好的网络模型参数如何保存?
坑:ML多GPU训练好的网络模型参数如何保存?,我发现,网络参数的结构都发生了变化。
再Load的时候,已经load不进来了
这里有两个策略:
第一个:找找有没有解决方案
这里有一个解决方案可以参考:
https://blog.csdn.net/m0_37477175/article/details/83378464
def get_model(input_shape):
.
.
.
return model
model = get_model(input_shape) #此时为单GPU 搭建的model
# metric
# loss
from keras.utils import multi_gpu_model
paralleled_model = multi_gpu_model(model,gpus=4) # 此时paralleled_model为4个GPU的模型,已经进行复制,但是seg_model仍然为单GPU model。
#seg_model.compile(optimizer=Adam) #训练结束,注释掉
paralleled_model.load_weights("multi_model.h5") # 加载之前训练保存的在多GPU上训练的模型参数
model.save('single_gpu_model.h5') # 保存单GPU的模型seg_model此时,保存的就是单模型参数!!
第二个:更改预测模型的网络结构,也改成并行的