PS:
这个好像是Python2.X版本的使用。
这个课件的numpy的介绍还是太少了,有点凌乱的感觉,要是后面还是要以《利用Python进行数据分析》做numpy和pandas课件笔记比较好。
要学会和掌握,通过实战,但是至少要懂得numpy的方式。
一、numpy(numeric Python)
1.定义:
高效方便的科学计算工具
2.优势:
2.1方便处理向量,矩阵
2.2相比于MATLAB免费
3.简单实用(版本查询)
import numpy as np
np.version.full_version
二、多维数组(homogeneous multidimensional)
1.一维数组
a=np.arange(20)
numpy.ndarray
a=a.reshape(4,5)#这个在《利用Python进行数据分析》算是numpy的高级用法
print(a)
a=a.reshape(2,2,5)#2个数组,2和5是2row,5col
print(a)
2.简单要素描绘
查看维度:
a.ndim
查看维度大小:
a.shape
查看全部的元素个数:
a.size
查看元素类型:
a.dtype
查看元素站位(bytes):
a.dtype
三、创建数组
1.高维数组转换嵌套列表:
raw=[1,2,3,4,5]
a=np.array(raw)
raw=[[0,1,2,3,4],[5,6,7,8,9]]
b=np.array(raw)
2.0数组:
d=(4,5)
np.zeros(d)
3.1数组
d=(4,5)
np.ones(d,dtype=int)
4.随机数组
生成[0,1)区间的随机数数组:
np.random.rand(5)
四、数组操作
1.加减乘除开根(这个的数据处理,必须是两个数组的结构要一致,对应的位置进行处理)
2.生成二维随机数组
a=np.arange(20).reshape(4,5)
3.步长生成:arange(起始,终止,步长)
a=np.arange(2,45,3).reshape(5,3)
4.生成一维数组
np.linspace(0,2,9)
五、数组元素访问
访问:
a=np.array([[3.2,1.5],[2.5,4]])
print(a[0][1])
print(a[0,1])
修改:
a[0][1]=值
广播机制:
1. b=a
a修改
b修改
2. b=a.copy()
a修改
b不修改
取矩阵中的指定列:
a=np.arange(20).reshape(4,5)
print(a[:,[1,3]])#先行后列,这里是指所有行,1,3是指第1列和第3列
筛选:
a[;,2][a[:,0]>5]
查找指定值:
loc=np.where(a==值)
print(loc)
print(a[loc[0][0],loc[1][0]])
六、数组操作
1.矩阵转置
a=np.random.rand(2,4)
a=np.transpose(a)
b=np.random.rand(2,4)
b=np.mat(b)
print(b.T)#转置
2.矩阵求逆
import numpy.linalg as nlg
a = np.random.rand(2,2)
a = np.mat(a)
print ("a:")
print(a)
ia = nlg.inv(a)
print( "inverse of a:")
print (ia)
print ("a * inv(a)")
print (a * ia)
3.求特征值和特征向量
a = np.random.rand(3,3)
eig_value, eig_vector = nlg.eig(a)
print( "eigen value:")
print( eig_value)
print( "eigen vector:")
print(eig_vector)
4.拼接两个向量
1.column_stack函数
a = np.array((1,2,3))
b = np.array((2,3,4))
print np.column_stack((a,b))
2.vstack,hstack函数
a = np.random.rand(2,2)
b = np.random.rand(2,2)
print( "a:")
print (a)
print ("b:")
print (b)
c = np.hstack([a,b])
d = np.vstack([a,b])
print( "horizontal stacking a and b:")
print( c)
print ("vertical stacking a and b:")
print( d)
七、缺失值
a = np.random.rand(2,2)
a[0, 1] = np.nan
print (np.isnan(a))
[[False True]
[False False]]