numpy增加维度、删除维度

楔子

在 TensorFlow 中,可以给一个 tensor 增加一个维度、删除一个维度,那么在 Numpy 中该怎么呢?

删除维度、增加维度

先来看看如何增加一个维度:

import numpy as np
arr = np.array([[[1, 2, 3], [2, 3, 4]]])
print(arr)
"""
[[[1 2 3]
  [2 3 4]]]
"""
print(arr.shape)  # (1, 2, 3)
# 事实上第一个维度我们是不需要的,因为在该维度上数组的长度是 1

# 删除第 1 个维度,我们看到已经改变了
print(np.squeeze(arr, 0))
"""
[[1 2 3]
 [2 3 4]]
"""

但是注意:只有数组长度在该维度上为 1,那么该维度才可以被删除。如果不是1,那么删除的话会报错。

import numpy as np
arr = np.array([[[1, 2, 3], [2, 3, 4]]])

print(arr.shape)  # (1, 2, 3)

try:
    # 删除第二个维度,显然在第二个维度上数组的长度是 2,不是 1
    # 所以它不能被删除
    print(np.squeeze(arr, 1))
except Exception as e:
    print(e)  # cannot select an axis to squeeze out which has size not equal to one

删除只能删除数组长度为 1 所对应的维度,同理添加也是添加一个维度也只是让数组在这个维度上的长度变成 1,因为数组本来不存在这个维度的,但是我们强行加上了一个维度,那么数组在这个维度上的长度只能是 1。

import numpy as np
arr = np.array([[1, 2, 3], [2, 3, 4]])

print(arr.shape)  # (2, 3)

# 很好理解
print(np.expand_dims(arr, 0).shape)  # (1, 2, 3)
print(np.expand_dims(arr, 1).shape)  # (2, 1, 3)
print(np.expand_dims(arr, 2).shape)  # (2, 3, 1)

arr = np.array([1, 2, 3])
print(np.expand_dims(arr, 0))
"""
[[1 2 3]]
"""
print(np.expand_dims(arr, 1))
"""
[[1]
 [2]
 [3]]
"""

以上就实现了数组维度的删除和增加,因为数组的元素是固定的,所以在删除维度和增加维度时,数组在该维度上的长度必须是 1。

另外,变化维度还可以使用 reshape,比如 arr 的维度是 (2, 1, 3),我们把第二个维度给去掉的话,那么直接 arr.reshape((2, 3)) 即可,增加维度也是同理,只要变化维度前后的元素个数不变即可。

import numpy as np

arr = np.array([[1, 2, 3], [2, 3, 4]])
print(arr.shape)  # (2, 3)
arr1 = arr.reshape((2, 1, 1, 3))
print(arr1)
"""
[[[[1 2 3]]]


 [[[2 3 4]]]]
"""
print(arr1.shape)  # (2, 1, 1, 3)
print(np.all(arr1.reshape((2, 3)) == arr))  # True

最后,增加维度还有一种做法,但用的不多,举个栗子:

import numpy as np


arr = np.array([[1, 2, 3], [2, 3, 4]])
print(arr.shape)  # (2, 3)
# 将维度变成 (2, 1, 3, 1, 1)
arr1 = arr[:, np.newaxis, :, np.newaxis, np.newaxis]
print(arr1.shape)  # (2, 1, 3, 1, 1)
# np.newaxis 等价于 None
print(arr[:, None, :, None, None].shape)  # (2, 1, 3, 1, 1)
# 使用 : 的部分和之前的维度是对应的,np.newaxis 或者 None 可以理解成 1
# 因此最终得到的数组的维度就是 (2, 1, 3, 1, 1)

# 再以一维数组为例
arr = np.array([1, 2, 3])
print(arr)
"""
[1 2 3]
"""
# 得到的数组的 shape 为 (1, 3)
print(arr[None, :])
"""
[[1 2 3]]
"""
# 得到的数组的 shape 为 (3, 1)
print(arr[:, None])
"""
[[1]
 [2]
 [3]]
"""

 

删除、增加一行或一列

说实话,改变数组的维度不是特别常见,更常见的是删除数组的一行或者一列,举个栗子:

# 原始数组
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
# 我们希望删除一行
[[ 0  1  2  3]
 [ 8  9 10 11]]
# 或者删除一列
[[ 0  2  3]
 [ 4  6  7]
 [ 8 10 11]]

这种需求相对来说更加常见一些,那么应该怎么做呢?我们来看一下。

删除一行或一列

首先是删除:

import numpy as np

arr = np.arange(0, 12).reshape(3, 4)
print(arr)
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 假设删除第二行
print(np.delete(arr, [1], axis=0))
"""
[[ 0  1  2  3]
 [ 8  9 10 11]]
"""
# 删除第一行和第三行
print(np.delete(arr, [0, 2], axis=0))
"""
[[4 5 6 7]]
"""
# 删除前两行,slice(0, 2) 也可以换成 np.s_[0: 2]
print(np.delete(arr, slice(0, 2), axis=0))
"""
[[ 8  9 10 11]]
"""

删除列的话也是同理,只需要将 axis=0 换成 axis=1 即可,注意:如果不指定 axis 或者 axis 指定为 None,那么会 np.delete 会将传递的数组扁平化(变成一维数组),然后进行删除。举个栗子:

arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr)
"""
[[1 2 3]
 [4 5 6]]
"""
# 会将 arr 扁平化处理,然后删除索引为 1 的元素,因此要注意 axis 参数
print(np.delete(arr, [1])) 
"""
[1 3 4 5 6]
"""

增加一行或一列

如果想增加一行或一列的话,要怎么做呢?

import numpy as np

arr = np.arange(0, 12).reshape(3, 4)
print(arr)
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 在尾部增加一行,注意:这里的维度一定要匹配,指定 [0, 0, 0, 0] 是不行的,因为 arr 是一个二维数组
print(np.append(arr, [[0, 0, 0, 0]], axis=0))
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [ 0  0  0  0]]
"""
# 在尾部增加一列,维度同样要匹配
print(np.append(arr, [[0], [0], [0]], axis=1))
"""
[[ 0  1  2  3  0]
 [ 4  5  6  7  0]
 [ 8  9 10 11  0]]
"""

如果不指定 axis,那么仍然会将传递的数组扁平化,然后进行追加:

arr = np.array([[1, 2, 3], [4, 5, 6]])
print(arr)
print(np.append(arr, 0))  # [1 2 3 4 5 6 0]
print(np.append(arr, [0, 0]))  # [1 2 3 4 5 6 0 0]
print(np.append(arr, [[0, 0]]))  # [1 2 3 4 5 6 0 0]

append 默认是在尾部进行追加,并且还要求维度要匹配,不是很方便。所以这里更推荐 insert 函数:

import numpy as np

arr = np.arange(0, 12).reshape(3, 4)
print(arr)
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 索引为 1 的位置插入一行,值全为 0
print(np.insert(arr, 1, 0, axis=0))
"""
[[ 0  1  2  3]
 [ 0  0  0  0]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 或者我们也可以手动指定
print(np.insert(arr, 1, [0, 0, 0, 0], axis=0))
"""
[[ 0  1  2  3]
 [ 0  0  0  0]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 二维数组也是可以的
print(np.insert(arr, 1, [[0, 0, 0, 0], [0, 0, 0, 0]], axis=0))
"""
[[ 0  1  2  3]
 [ 0  0  0  0]
 [ 0  0  0  0]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 插入一列,注意元素个数要匹配,每一列是 3 个元素
print(np.insert(arr, 1, [[0, 0, 0], [0, 0, 0]], axis=1))
"""
[[ 0  0  0  1  2  3]
 [ 4  0  0  5  6  7]
 [ 8  0  0  9 10 11]]
"""

我们看到 insert 比 append 要方便很多,并且功能也更加强大一些,并且 append 完全可以使用 insert 实现,举个栗子:

import numpy as np

arr = np.arange(0, 12).reshape(3, 4)
print(arr)
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
# 在尾部增加一行
print(np.insert(arr, arr.shape[0], 0, axis=0))
"""
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [ 0  0  0  0]]
"""
# 在尾部增加一列
print(np.insert(arr, arr.shape[1], 0, axis=1))
"""
[[ 0  1  2  3  0]
 [ 4  5  6  7  0]
 [ 8  9 10 11  0]]
"""

最后,如果 insert 不指定维度,那么也是会先将数组扁平化,然后在进行 insert,举个栗子:

arr = np.array([[1, 2, 3], [4, 5, 6]])
print(np.insert(arr, 1, [0, 0]))  # [1 0 0 2 3 4 5 6]

总的来说还是比较简单的。

posted @ 2020-04-03 21:23  古明地盆  阅读(51168)  评论(0编辑  收藏  举报