Hybrid - Faster training and easy deployment

HybridBlock

HybridBlock类似于Block但是有一些限制：

HybridBlock的所有子层也必须是HybridBlock。
只能使用同时为NDArray和Symbol实现的方法。例如，不能使用.asnumpy（）、.shape等。
运行时操作无法更改。例如，不能对每个迭代执行if x:if x。

想利用混合编程，就需要子类化HybridBlock：

import mxnet as mx
from mxnet import gluon
from mxnet.gluon import nn

mx.random.seed(42)

class Net(gluon.HybridBlock):
    def __init__(self, **kwargs):
        super(Net, self).__init__(**kwargs)
        with self.name_scope():
            # layers created in name_scope will inherit name space
            # from parent layer.
            self.conv1 = nn.Conv2D(6, kernel_size=5)
            self.pool1 = nn.MaxPool2D(pool_size=2)
            self.conv2 = nn.Conv2D(16, kernel_size=5)
            self.pool2 = nn.MaxPool2D(pool_size=2)
            self.fc1 = nn.Dense(120)
            self.fc2 = nn.Dense(84)
            # You can use a Dense layer for fc3 but we do dot product manually
            # here for illustration purposes.
            self.fc3_weight = self.params.get('fc3_weight', shape=(10, 84))

    def hybrid_forward(self, F, x, fc3_weight):
        # Here `F` can be either mx.nd or mx.sym, x is the input data,
        # and fc3_weight is either self.fc3_weight.data() or
        # self.fc3_weight.var() depending on whether x is Symbol or NDArray
        print(x)       
        x = self.pool1(F.relu(self.conv1(x)))
        x = self.pool2(F.relu(self.conv2(x)))
        # 0 means copy over size from corresponding dimension.
        # -1 means infer size from the rest of dimensions.
        x = x.reshape((0, -1))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = F.dot(x, fc3_weight, transpose_b=True)
        return x

⚠️注意上面的前向函数中有F，x；对于pytorch而言这里只有x代表输入数据。下面分析这种情况。

Hybridize

默认情况下，HybridBlock会像标准的Block那样执行（也像pytorch那样），每次调用都会forward起来：

net = Net()
net.initialize()
x = mx.nd.random_normal(shape=(16, 1, 28, 28))
net(x)
x = mx.nd.random_normal(shape=(16, 1, 28, 28))
net(x)

注意上面hybrid_forward中的print(x)，这里调用两次net（x），所以会打印两次输出，一切看起来都很normal。可是当调用.hybridize（）时就会发生：

net.hybridize()
x = mx.nd.random_normal(shape=(16, 1, 28, 28))
net(x)
x = mx.nd.random_normal(shape=(16, 1, 28, 28))
net(x)

在调用hybridize（）之后，只有第一次前向时会打印一个symbol，之后的前向操作都不会调用hybrid_forward函数，所以前向时不会有任何输出。

hybridize会加速执行并节省内存。如果网络顶层不是HybridBlock，你仍然可以使用.hybridize（）来符号化，这时gluon就会试着符号化所有他的孩子。

hybridize也可以接受一些参数来调整performance：

net.hybridize(static_alloc=True)
# or
net.hybridize(static_alloc=True, static_shape=True)

Serializing trained model for deployment

作为HybridBlock，大多情况是可以很容易序列化的，序列化的模型可在以后用许多语言部署，C,C++和Scala。为此，利用export和SymbolBlock.imports来保存和载入：

# 保存
net(x)
net.export('model', epoch=1)

此时将会生成两个文件：model-symbol.json and model-0001.params 。可用任何语言进行载入，当然也可用SymbolBlock进行载入：

import warnings

with warnings.catch_warnings():
    warnings.simplefilter("ignore")
    net2 = gluon.SymbolBlock.imports('model-symbol.json', ['data'], 'model-0001.params')

Operators that do not work with hybridize

如果想混合编程，必须在“hybrid_forward”函数中使用F.some_operator，说白了就是用一些特定的操作符。在hybridize之前F为mxnet.nd，之后就会变为mxnet.sym。虽然大多数api在NDArray和Symbol中是相同的，但它们之间存在一些差异。编写F.some_operator和调用hybrize可能不会一直工作。这里列出了一些常用的不能hybridize的NDArray api，并提供了解决方法。

Element-wise Operators

在NDArray api中，如果输入的NDArray具有不同的形状，则会自动广播以下算术和比较api。但是Symbol API不是这样的。它不会自动广播，必须手动指定对预期具有不同形状的符号使用另一组广播运算符。

目前的解决方法是使用相应的广播运算符进行运算和比较，以避免在输入形状不同时可能出现的hybridize失败。

例如，如果想给你的输入加一个ndarray，那么应当利用broadcast_add而非 + ：

def hybrid_forward(self, F, x):
    # avoid writing: return x + F.ones((1, 1))
    return F.broadcast_add(x, F.ones((1, 1)))

如果用的是➕，那么在hubridize之前是没问题的，而之后就可能导致形状不匹配。

Shape

Gluon的命令式交互非常灵活，允许打印NDArray的形状。但是，symbol没有形状属性。因此要避免在hubrid_forward中打印shape。否则，将出现以下错误：

AttributeError: 'Symbol' object has no attribute 'shape'

Slice

NDArray中索引很正常，而Symbol中的索引【】是得到grouped symbol的输出。在hybrid前后会得到不同的输出：

def hybrid_forward(self, F, x):
    return x[0]

Not implemented operators

一些在NDArray中常用的operators并没有在Symbol中实现，可能会导致错误：

NDArray.asnumpy：symbol中没这个操作，在hybrid_forward中不要用这个。

mx.nd.array（）：symbol中没有array的API，目前只有F.ones, F.zeros, or F.full

posted @ 2020-06-09 16:13 三年一梦阅读(419) 评论(0) 收藏举报

刷新页面返回顶部

三年一梦

Hybrid - Faster training and easy deployment

Hybrid - Faster training and easy deployment

HybridBlock

Hybridize

Serializing trained model for deployment

Operators that do not work with hybridize

Element-wise Operators

Shape

Slice

Not implemented operators

公告