numpy使用
numpy使用
数据分析:是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律
使用工具:Numpy,Pandas,Matplotlib
Numpy:是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
创建ndarray
使用np.array()
先导入numpy模块
import numpy as np
一维数组创建
np.array([1,2,3])
二维数组创建
np.array([[1,2,3],[4,5,6]])
np.array([[1,'two',3],[4,5,6]])
注意点:
1.numpy默认ndarray的所有元素的类型是相同的
2.如果传进来的列表中包含不同的类型,则统一为同一类型,优先级:str>float>int
应用示例:
使用matplotlib.pyplab获取一个numpy数组,数据来源于一张图片
import matplotlib.pylab as plt
# plt.imread方法获取图片的numpy数组
img_arr = plt.imread('./cat.jpg')
# 将一个图片的numpy数组显示成图片
plt.imshow(img_arr)
# 对数组中的每一个元素都减100,同时相应的图片发生了变化
plt.imshow(img_arr-100)
使用np的routines函数创建
np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None) 等差数列
创建一个等差数列
# 创建的数列有20项
np.linspace(0,100,num=20)
# 创建数列每项相差2
np.arange(0,100,2)
创建一个指定维度的numpy数组
随机性
#固定随机性
#随机因子:系统的时间
# 固定随性性,指定了随机因子,在进行创建时,得到数组一样,不在具有随机性
np.random.seed(100)
arr = np.random.randint(0,100,size=(4,5))
生成0到1的随机数,左闭右开 np.random.seed(3)
np.random.random(size=None)
np.random.random(size=(4,5))
ndarray的属性
ndim:维度
shape:形状(各维度的长度)
size:总长度
dtype:元素类型
存在随机数组arr
arr.shape
arr.ndim
arr.size
arr.dtype
ndarray的基本操作
一维的时候与列表完全一致,多维以此类推
索引
arr = array([[ 8, 24, 67, 87, 79],
[48, 10, 94, 52, 98],
[53, 66, 98, 14, 34],
[24, 15, 60, 58, 16]])
a[1]
a[2][2]
切片
获取数据
#获取二维数组前两行
arr[0:2]
# 获取二维数组前两列
arr[:,0:2]
,分隔行和列,前面属于行的切片,后面属于列的切片
# 获取二维数组前两行和前两列的数据
arr[0:2,0:2]
颠倒次序
# 将数组的行倒序
arr[::-1]
# 将数组的列倒序
arr[:,::-1]
# 全部到序
arr[::-1,::-1]
图片应用:
#将图片进行全倒置操作
# 倒置前
plt.imshow(img_arr)
# 列倒序:左右颠倒
plt.imshow(img_arr[:,::-1,:])
# 上下左右都颠倒
plt.imshow(img_arr[::-1,::-1,:])
# 对图片进行裁剪
# 方法:利用切片对像素点进行获取
plt.imshow(img_arr[100:340,170:565,:])
变形
使用arr.reshape()
函数,参数是一个元组
基本使用
1.将一维数组形变成多维数组
arr_1.reshape((2,10))
arr_1.reshape((5,-1))
2.将多维数组变形成一维数组
arr_1 = arr.reshape((20,))
级联
np.concatenate()
一维,二维,多维数组的级联,实际操作中级联多为二维数组
把几个numpy数组合并成一个
np.concatenate((arr,arr,arr),axis=1)
axis参数指定轴向
1表示x轴,横向合并
0表示y轴,纵向合并
图片应用:将两张图片进行合并
# 先横向合并三张
img_3 = np.concatenate((img_arr,img_arr,img_arr),axis=1)
# 再将横向合并三张的结果纵向合并三张,形成九宫格图片
img_9 = np.concatenate((img_3,img_3,img_3),axis=0)
plt.imshow(img_9)
级联需要注意的点:
1.级联的参数是列表:一定要加中括号或小括号
2.维度必须相同
3.形状相符:在维度保持一致的前提下,如果进行横向(axis=1)级联,必须保证进行级联的数组行数保持一致。如果进行纵向(axis=0)级联,必须保证进行级联的数组列数保持一致。
4.可通过axis参数改变级联的方向
ndarray的聚合操作
求和
np.sum(axis=1)
arr.sum(axis=1)
axis参数同样是表示轴向
其它的操作用法一致
Function Name NaN-safe Version Description
np.sum np.nansum Compute sum of elements
np.prod np.nanprod Compute product of elements
np.mean np.nanmean Compute mean of elements
np.std np.nanstd Compute standard deviation
np.var np.nanvar Compute variance
np.min np.nanmin Find minimum value
np.max np.nanmax Find maximum value
np.argmin np.nanargmin Find index of minimum value
np.argmax np.nanargmax Find index of maximum value
np.median np.nanmedian Compute median of elements
np.percentile np.nanpercentile Compute rank-based statistics of elements
np.any N/A Evaluate whether any elements are true
np.all N/A Evaluate whether all elements are true
np.power 幂运算
ndarray的排序
np.sort()与ndarray.sort()都可以,但有区别:
np.sort()不改变输入
ndarray.sort()本地处理,不占用空间,但改变输入
np.sort(arr,axis=0) # arr的内容未发生改变
arr.sort(axis=0) # arr的内容发生了改变