Python——NumPy数据存取与函数
1、数据csv文件存贮
1.1 CSV文件写入
CSV (Comma‐Separated Value, 逗号分隔值)
CSV是一种常见的文件格式,用来存储批量数据
np.savetxt(frame, array, fmt='%.18e', delimiter=None)
• frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
• array : 存入文件的数组
• fmt : 写入文件的格式,例如:%d %.2f %.18e
• delimiter : 分割字符串,默认是任何空格
import numpy as np a=np.arange(100).reshape((5,20)) np.savetxt('a.csv',a,fmt='%d',delimiter=',')
np.savetxt(r"C:\Users\ning wang\Desktop\Python\python_data\a.csv",a,fmt='%.1f',delimiter=',')
指定位置的保存文件
np.savetxt("C:/Users/ning wang/Desktop/Python/python_data/b.csv",a,fmt='%.1f',delimiter=',')
以上两种方法,指定位置的存放文件。原因是由于'\'具有转义符,改为‘/’或者前面加‘r’。
1.2 CSV文件读取
np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)
• frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
• dtype : 数据类型,可选
• delimiter : 分割字符串,默认是任何空格
• unpack : 如果True,读入属性将分别写入不同变量
c=np.loadtxt('a.csv',delimiter=',')%默认为float
c=np.loadtxt('C:/Users/ning wang/Desktop/Python/python_data/b.csv',dtype=np.int,delimiter=',')%更改为整数格式
1.3 csv局限性
CSV只能有效存储一维和二维数组
np.savetxt() np.loadtxt()只能有效存取一维和二维数组
2、多维数据存取
(1)多维数据写入
a.tofile(frame, sep='', format='%s')
• frame : 文件、字符串
• sep : 数据分割字符串,如果是空串,写入文件为二进制
• format : 写入数据的格式
a.tofile('C:/Users/ning wang/Desktop/Python/python_data/a.dat',sep=',',format='%d')%逗号区分
a.tofile('C:/Users/ning wang/Desktop/Python/python_data/b.dat',sep=' ',format='%.1f')%空格区分
a.tofile('C:/Users/ning wang/Desktop/Python/python_data/c.dat',format='%d')%默认的二进制格式
(2)读取多维数据
np.fromfile(frame, dtype=float, count=‐1, sep='')
• frame : 文件、字符串
• dtype : 读取的数据类型
• count : 读入元素个数,‐1表示读入整个文件
• sep : 数据分割字符串,如果是空串,写入文件为二进制
a=np.arange(100).reshape(5,10,2) a.tofile('C:/Users/ning wang/Desktop/Python/python_data/a.dat',sep=',',format='%d') c=np.fromfile('C:/Users/ning wang/Desktop/Python/python_data/a.dat',dtype=np.int,sep=',')
c=c.reshape((5,10,2))
a=np.arange(100).reshape(5,10,2) a.tofile('C:/Users/ning wang/Desktop/Python/python_data/a.dat',format='%d')%未指定分隔符,默认二进制存储 c=np.fromfile('C:/Users/ning wang/Desktop/Python/python_data/a.dat',dtype=np.int)%不用指定分隔符,默认二进制读取,转换为int型
该方法需要读取时知道存入文件时数组的维度和元素类型
a.tofile()和np.fromfile()需要配合使用
可以通过元数据文件来存储额外信息
3、NumPy便捷文件存取
np.save(fname, array) 或 np.savez(fname, array)
• fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
• array : 数组变量
np.load(fname)
• fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
a=np.arange(100).reshape(5,10,2) np.save('C:/Users/ning wang/Desktop/Python/python_data/a.npy',a)
b=np.load('C:/Users/ning wang/Desktop/Python/python_data/a.npy')
4、NumPy的随机数函数
NumPy的random子库
np.random.*
(1)
np.random.rand()
np.random.randn()
np.random.randint()
import numpy as np a=np.random.rand(3,4,5)
sn=np.random.randn(2,4,5)
b=np.random.randint(100,200,(3,4))
随机种子不变的话,随机数不变
(2)
(3)
5、NumPy的统计函数
NumPy直接提供的统计类函数
np.*
np.std() np.var() np.average()
(1)
(2)
6、NumPy的梯度函数