Numpy中扁平化函数ravel()和flatten()的区别
在Numpy中经常使用到的操作由扁平化操作,Numpy提供了两个函数进行此操作,他们的功能相同,但在内存上有很大的不同.
先来看这两个函数的使用:
1 from numpy import * 2 3 a = arange(12).reshape(3,4) 4 print(a) 5 # [[ 0 1 2 3] 6 # [ 4 5 6 7] 7 # [ 8 9 10 11]] 8 print(a.ravel()) 9 # [ 0 1 2 3 4 5 6 7 8 9 10 11] 10 print(a.flatten()) 11 # [ 0 1 2 3 4 5 6 7 8 9 10 11]
可以看到这两个函数实现的功能一样,但我们在平时使用的时候flatten()更为合适.在使用过程中flatten()分配了新的内存,但ravel()返回的是一个数组的视图.视图是数组的引用(说引用不太恰当,因为原数组和ravel()返回后的数组的地址并不一样),在使用过程中应该注意避免在修改视图时影响原本的数组.这是什么意思咧,我们通过代码来具体解释:
1 from numpy import * 2 3 a = arange(12).reshape(3,4) 4 print(a) 5 # [[ 0 1 2 3] 6 # [ 4 5 6 7] 7 # [ 8 9 10 11]] 8 9 # 创建一个和a相同内容的数组b 10 b = a.copy() 11 c = a.ravel() 12 d = b.flatten() 13 # 输出c和d数组 14 print(c) 15 # [ 0 1 2 3 4 5 6 7 8 9 10 11] 16 print(d) 17 # [ 0 1 2 3 4 5 6 7 8 9 10 11] 18 # 可以看到c和d数组都是扁平化后的数组,具有相同的内容 19 20 print(a is c) 21 # False 22 print(b is d) 23 # False 24 # 可以看到以上a,b,c,d是四个不同的对象 25 26 # 但因为c是a的一种展示方式,虽然他们是不同的对象,但在修改c的时候,a中相应的数也改变了 27 c[1] = 99 28 d[1] = 99 29 print(a) 30 # [[ 0 99 2 3] 31 # [ 4 5 6 7] 32 # [ 8 9 10 11]] 33 print(b) 34 # [[ 0 1 2 3] 35 # [ 4 5 6 7] 36 # [ 8 9 10 11]] 37 print(c) 38 # [ 0 99 2 3 4 5 6 7 8 9 10 11] 39 print(d) 40 # [ 0 99 2 3 4 5 6 7 8 9 10 11]
通过以上的分析,在实际应用中应尽量使用flatten()函数,这样避免意外的错误.