Python——Numpy基础知识(一)

一、Numpy的引入

1、标准的Python 中用列表(list)保存一组值,可以当作数组使用。但由于列表的元素可以是任何对象,因此列表中保存的是对象的指针。对于数值运算来说,这种结构显然比较浪费内存和CPU 计算
2、虽然Python 提供了array 模块,它和列表不同,能直接保存数值,但是由于它不支持多维数组,也没有各种运算函数,因此也不适合做数值运算。
 
  NumPy 的诞生弥补了这些不足。
  NumPy 提供了两种基本的对象:ndarray(n-dimensional array object)和ufunc(universal function object)。
  ndarray(下文统一称之为数组)是存储单一数据类型的多维数组,而ufunc 则是能够对数组进行处理的函数。

二、Numpy简介

Numpy 是一个专门用于矩阵化运算、科学计算的开源Python库,Numpy将Python相当于变成一种免费的更强大的Matlab系统
优势:
1、强大的 ndarray 多维数组结构
2、成熟的函数库
3、用于整合C/C++和Fortran代码的工具包
4、实用的线性代数、傅里叶变换和随机数模块
5、Numpy 和稀疏矩阵运算包scipy 配合使用非常方便

三、语法简介

首先,简单的创建数组及相关操作:

 1 import numpy as np
 2   #生成简单的一维矩阵
 3 a=np.array([1,2,3,4])     
 4   #生成简单的二维矩阵
 5 c=np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])
 6   #获取类型
 7 print(type(a))
 8   #数组的大小可以通过其属性获得
 9 print (a.shape,b.shape)
10   #打印数组
11 print (c)
12   #可以通过修改数组的shape属性,在爆出数组元素个数不变的情况下,改变数组每个轴的长度
13 c.shape=4,3
14   ##注意,并不是对数组进行转置,而是只改变每个轴的大小
15 print(c)
16     #当某个轴的元素为-1时,将根据数组元素的阁主自动计算此轴的长度
17 c.shape=2,-1
18 print(c)
19   #使用reshape方法可以创建一个改变了尺寸的新数组,原数组保持不变
20 d=a.reshape((2,2))
21 print(d)
22 print(a)
23 d=c.reshape((3,3))#不能讲一个12个元素的数组分成3*3,会报错
24 print(c)
25   #数组a和d实际上时共享数据存储内存区域,修改其一另一个也会改变

输出

<class 'numpy.ndarray'>#打印类型
#shape (4,) (3, 4)
#打印数组
[[
1 2 3 4] [ 4 5 6 7] [ 7 8 9 10]]
#修改轴长 [[
1 2 3] [ 4 4 5] [ 6 7 7] [ 8 9 10]]
#修改轴长,其一参数为-1 [[
1 2 3 4 4 5] [ 6 7 7 8 9 10]]
#reshape [[
1 2] [3 4]] [1 2 3 4]
#错误
--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-13-430fc5495966> in <module>() 21 print(d) 22 print(a) ---> 23 d=c.reshape((3,3)) 24 print(c) ValueError: cannot reshape array of size 12 into shape (3,3)

上面的例子都是先创建一个Python序列,然后通过array函数将其转换为数组,这样做显然效率不高。因此NumPy提供了很多专门用来创建数组的函数。

初始化数组:

 1 import numpy as np
 2 a=np.arange(0,1,0.1)
 3 print("a=",a)
 4 b=np.linspace(0,1,10)
 5 print("b=",b)
 6 c=np.linspace(0,1,10,endpoint=False)
 7 print("c=",c)
 8 d=np.logspace(0,2,20)
 9 print("d=",d)
10 e=np.empty((2,3),np.int)
11 print("e=",e)
12 f=np.zeros(4,np.float)
13 print("f=",f)

运行结果:

a= [0.  0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
b= [0.         0.11111111 0.22222222 0.33333333 0.44444444 0.55555556
 0.66666667 0.77777778 0.88888889 1.        ]
c= [0.  0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
d= [  1.           1.27427499   1.62377674   2.06913808   2.6366509
   3.35981829   4.2813324    5.45559478   6.95192796   8.8586679
  11.28837892  14.38449888  18.32980711  23.35721469  29.76351442
  37.92690191  48.32930239  61.58482111  78.47599704 100.        ]
e= [[          0           0  1863334416]
 [        588           0 -2147483648]]
f= [0. 0. 0. 0.]

   arange函数类似于python的range函数,通过指定开始值、终值和步长来创建一维数组,注意数组不包括终值。

  linspace函数通过指定开始值、终值和元素个数来创建一维数组,可以通过endpoint关键字指定是否包括终值,缺省设置是包括终值:
  numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
  Endpoint 如果是真,则一定包括stop,如果为False,一定不会有stop

  #numpy.logspace(start, stop, num, endpoint=true, base=10, dtype)
  #数据头一定是base^start,若endpoint=True,数据尾为base^end,其余数据为base^(start,end)
   logspace函数和linspace类似,不过它创建等比数列,下面的例子产生1(10^0)到100(10^2)、有20个元素的等比数列。

  zeros()、ones()、empty()可以创建指定形状和类型的数组。
  此外,zeros_like()、ones_like()、empty_like()等函数可创建与参数数组的形状及类型相同的数组。因此,“zeros_like(a)”和“zeros(a.shape, a.dtype)”的效果相同。
 
存取元素:
 1 >>> a = np.arange(10)
 2 >>> a[5] # 用整数作为下标可以获取数组中的某个元素
 3 5
 4 >>> a[3:5] # 用范围作为下标获取数组的一个切片,包括a[3]不包括a[5]
 5 array([3, 4])
 6 >>> a[:5] # 省略开始下标,表示从a[0]开始
 7 array([0, 1, 2, 3, 4])
 8 >>> a[:-1] # 下标可以使用负数,表示从数组后往前数
 9 array([0, 1, 2, 3, 4, 5, 6, 7, 8])
10 >>> a[2:4] = 100,101 # 下标还可以用来修改元素的值
11 >>> a
12 array([ 0, 1, 100, 101, 4, 5, 6, 7, 8, 9])
13 
14 >>> a[1:-1:2] # 范围中的第三个参数表示步长,2表示隔一个元素取一个元素
15 array([ 1, 101, 5, 7])
16 >>> a[::-1] # 省略范围的开始下标和结束下标,步长为-1,整个数组头尾颠倒
17 array([ 9, 8, 7, 6, 5, 4, 101, 100, 1, 0])
18 >>> a[5:1:-2] # 步长为负数时,开始下标必须大于结束下标
19 array([ 5, 101])
20 
21 >>> b = a[3:7] # 通过下标范围产生一个新的数组b,b和a共享同一块数据空间
22 >>> b
23 array([101, 4, 5, 6])
24 >>> b[2] = -10 # 将b的第2个元素修改为-10
25 >>> b
26 array([101, 4, -10, 6])
27 >>> a # a的第5个元素也被修改为10
28 array([ 0, 1, 100, 101, 4, -10, 6, 7, 8, 9])

  除了使用下标范围存取元素之外,NumPy还提供了两种存取元素的高级方法。
  1、使用整数序列
        当使用整数序列对数组元素进行存取时,将使用整数序列中的每个元素作为下标,整数序列可以是列表或者数组。使用整数序列作为下标获得的数组不和原始数组共享数据空间。

 1 >>> x = np.arange(10,1,-1)
 2 >>> x
 3 array([10, 9, 8, 7, 6, 5, 4, 3, 2])
 4 >>> x[[3, 3, 1, 8]] # 获取x中的下标为3, 3, 1, 8的4个元素,组成一个新的数组
 5 array([7, 7, 9, 2])
 6 >>> b = x[np.array([3,3,-3,8])] #下标可以是负数
 7 >>> b[2] = 100
 8 >>> b
 9 array([7, 7, 100, 2])
10 >>> x # 由于b和x不共享数据空间,因此x中的值并没有改变
11 array([10, 9, 8, 7, 6, 5, 4, 3, 2])
12 >>> x[[3,5,1]] = -1, -2, -3 # 整数序列下标也可以用来修改元素的值
13 >>> x
14 array([10, -3, 8, -1, 6, -2, 4, 3, 2])

注:”:”用以表示当前维度的所有子模块 ; “-1”用以表示当前维度所有子模块最后一个;”负号用以表示从后往前数的元素”
  2、使用布尔数组

  当使用布尔数组b作为下标存取数组x中的元素时,将收集数组x中所有在数组b中对应下标为True的元素。
        使用布尔数组作为下标获得的数组不和原始数组共享数据空间,注意这种方式只对应于布尔数组,不能使用布尔列表。

 1 >>> x = np.arange(5,0,-1)
 2 >>> x
 3 array([5, 4, 3, 2, 1])
 4 
 5 >>> x=np.random.rand(10)
 6 >>> x
 7 array([ 0.5993579 ,  0.68693925,  0.74380945,  0.40993085,  0.72345401, 0.64499497,  0.48715468,  0.80924589,  0.43362779,  0.06554248])
 8 >>> x>0.5 #对每个元素都比较
 9 array([ True,  True,  True, False,  True,  True, False,  True, False, False], dtype=bool)
10 >>> x[x>0.5] #将它当做索引传回原数组,只获取那些>0.5的
11 array([ 0.5993579 ,  0.68693925,  0.74380945,  0.72345401,  0.64499497, 0.80924589])
12 >>> np.all(x<1) #测试x<1所返回的数组(传给all)中所有元素是否都等价True  
13 >>> a=np.array([1,2,3])
14 >>> b=np.array([3,2,1])
15 >>> a>b #对应位置作比较
16 array([False, False,  True], dtype=bool)
17 >>> a[a==b] #获取一样的
18 array([2])
19 >>>(a==b).all()
20 >>>(a==b).any()
21 >>> np.any([1,2,3,4]) #如果传入的数组中有至少一个元素等价True都返回True
22 True

 

posted @ 2018-11-17 23:21  芩溪儿  阅读(1371)  评论(0编辑  收藏  举报