广播 (broadcasting)

广播 (broadcasting)

飞桨(PaddlePaddle,以下简称Paddle)和其他框架一样,提供的一些API支持广播(broadcasting)机制,允许在一些运算时使用不同形状的张量。 通常来讲,如果有一个形状较小和一个形状较大的张量,希望多次使用较小的张量来对较大的张量执行一些操作,看起来像是较小形状的张量的形状,首先被扩展到和较大形状的张量一致,然后做运算。 值得注意的是,这期间并没有对较小形状张量的数据拷贝操作。

飞桨的广播机制主要遵循如下规则(参考 Numpy 广播机制 ):

  1. 每个张量至少为一维张量
  2. 从后往前比较张量的形状,当前维度的大小要么相等,要么其中一个等于一,要么其中一个不存在

例如:

import paddle

 

x = paddle.ones((2, 3, 4))

y = paddle.ones((2, 3, 4))

# 两个张量 形状一致,可以广播

z = x + y

print(z.shape)

# [2, 3, 4]

 

x = paddle.ones((2, 3, 1, 5))

y = paddle.ones((3, 4, 1))

# 从后向前依次比较:

# 第一次:y的维度大小是1

# 第二次:x的维度大小是1

# 第三次:x和y的维度大小相等

# 第四次:y的维度不存在

# 所以 x和y是可以广播的

z = x + y

print(z.shape)

# [2, 3, 4, 5]

 

# 相反

x = paddle.ones((2, 3, 4))

y = paddle.ones((2, 3, 6))

# 此时x和y是不可广播的,因为第一次比较 4不等于6

# z = x + y

# InvalidArgumentError: Broadcast dimension mismatch.

现在知道什么情况下两个张量是可以广播的,两个张量进行广播语义后的结果张量的形状计算规则如下:

  1. 如果两个张量的形状的长度不一致,那么需要在较小形状长度的矩阵向前添加1,直到两个张量的形状长度相等。
  2. 保证两个张量形状相等之后,每个维度上的结果维度就是当前维度上较大的那个。

例如:

import paddle

 

x = paddle.ones((2, 1, 4))

y = paddle.ones((3, 1))

z = x + y

print(z.shape)

# z的形状: [2,3,4]

 

x = paddle.ones((2, 1, 4))

y = paddle.ones((3, 2))

# z = x + y

# ValueError: (InvalidArgument) Broadcast dimension mismatch.

 

posted @ 2021-02-11 08:58  吴建明wujianming  阅读(893)  评论(0编辑  收藏  举报