数据分析-Numpy
什么是Numpy
NumPy这个词来源于两个单词-- Numerical和Python。 NumPy是Python中的一个运算速度非常快的一个数学库,它非常重视数组,很多的数据科学的包都是依赖于Numpy的。它允许你在Python中进行向量和矩阵计算,并且由于许多底层函数实际上是用C编写的,因此你可以体验在原生Python中永远无法体验到的速度。
安装
pip install numpy
ndarray
numpy所有的操作都是围绕着数组展开的,这个数组的名字就叫做 ndarray ,在学习ndarray数组之前肯定有人会说这个东西和Python中的列表差不多啊,为什么不用列表呢,列表还要方便些。但是事实上通过ndarray不管是方便还是效率都远远地提升了。
ndarray数组创建
数组内的元素类型必须一致
数组大小不可修改
方法 | 描述 |
---|---|
array() | 将python的列表转换为数组,可选择显式指定dtype |
arange() | range的numpy版,支持浮点数 |
linspace() | 类似arange(),第三个参数为数组长度 |
zeros() | 根据指定形状和dtype创建全0数组 |
ones() | 根据指定形状和dtype创建全1数组 |
empty() | 根据指定形状和dtype创建空数组(随机值) |
eye() | 根据指定边长和dtype创建单位矩阵 |
import numpy as np
lis = [1,2,3,4,5]
np.array(lis)
array([1, 2, 3, 4, 5])
np.arange(10)
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
np.arange(0.5,10.5,1)
array([0.5, 1.5, 2.5, 3.5, 4.5, 5.5, 6.5, 7.5, 8.5, 9.5])
#取范围内的n个数,差值相同
np.linspace(1,10,10)
array([ 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.])
np.zeros((2,2))
array([[0., 0.],
[0., 0.]])
#ones和empty和zeros类似,但是empty会优先找内存中的数据,不一定是随机的
np.eye(4,4)
array([[1., 0., 0., 0.],
[0., 1., 0., 0.],
[0., 0., 1., 0.],
[0., 0., 0., 1.]])
常用属性
属性 | 描述 |
---|---|
T | 数组的转置(对高维数组而言) |
dtype | 数组元素的数据类型 |
size | 数组元素的个数 |
ndim | 数组的维数 |
shape | 数组的维度大小(以元组形式) |
itemsize | 每个项占用的字节数 |
nbytes | 数组中的所有数据消耗掉的字节数 |
数据类型
dtype
类型 | 描述 |
---|---|
布尔型 | bool_ |
整型 | int_ int8 int16 int32 int 64 |
无符号整型 | uint8 uint16 uint32 uint64 |
浮点型 | float_ float16 float32 float64 |
#查看数据类型
zx = np.ones((10,10))
zx.dtype
dtype('float64')
#修改数据类型
data = zx.astype(np.int16)
data.dtype
dtype('int16')
#注意
int8占1个字节,1字节(byte)占8位(bit)
其中最高位代表符号位 1-负号;0-正号
范围为1 1 1 1 1 1 1 1到0 1 1 1 1 1 1 1
1 0 0 0 0 0 0 为-128 0 0 0 0 0 0 0 0为0,一共256个数
范围-128-127
运算
#乘数字
z1 = [1,2,3,4,5,6]
z1 = np.array(z1)
z1 * 2
array([ 2, 4, 6, 8, 10, 12])
#乘数组,注意要一样的数组才能计算
z2 = [4,4,4,2,1,8]
z1 * z2
array([ 4, 8, 12, 8, 5, 48])
#除此之外加减乘除类似
索引切片
#维度转换
data = np.ones((10))
#转2X5的二维
zx = data.reshape(2,5)
#转一维
zx.reshape(10)
切片,索引
zx=([[ 0, 1, 2, 3, 4, 5],
[ 6, 7, 8, 9, 10, 11],
[12, 13, 14, 15, 16, 17],
[18, 19, 20, 21, 22, 23],
[24, 25, 26, 27, 28, 29]])
data = np.array(zx)
#0
data[0,0]
#8,9 14,15
data[1:3,2:4]
#3x3
data[:3,:3]
#步长2
data[::2,::2]
布尔型索引-筛选数据
#筛选大于5的数据
a[a>5]
他会把每一个数据和5比较,如果满足条件就返回数据
一元函数
函数 | 功能 |
---|---|
abs、fabs | 分别是计算整数和浮点数的绝对值 |
sqrt | 计算各元素的平方根 |
square | 计算各元素的平方 |
exp | 计算各元素的指数e**x |
log | 计算自然对数 |
sign | 计算各元素的正负号 |
ceil | 计算各元素的ceiling值 |
floor | 计算各元素floor值,即小于等于该值的最大整数 |
rint | 计算各元素的值四舍五入到最接近的整数,保留dtype |
modf | 将数组的小数部分和整数部分以两个独立数组的形式返回,与Python的divmod方法类似 |
isnan | 判断数组中的缺失值 |
isinf | 表示那些元素是无穷的布尔型数组 |
cos,sin,tan | 普通型和双曲型三角函数 |
二元函数
函数 | 功能 |
---|---|
add | 将数组中对应的元素相加 |
subtract | 从第一个数组中减去第二个数组中的元素 |
multiply | 数组元素相乘 |
divide、floor_divide | 除法或向下圆整除法(舍弃余数) |
power | 对第一个数组中的元素A,根据第二个数组中的相应元素B计算A**B |
maximum,fmax | 计算最大值,fmax忽略NAN |
miximum,fmix | 计算最小值,fmin忽略NAN |
mod | 元素的求模计算(除法的余数) |
数学统计
函数 | 功能 |
---|---|
sum | 求和 |
cumsum | 求前缀和 |
mean | 求平均数 |
std | 求标准差 |
var | 求方差 |
min | 求最小值 |
max | 求最大值 |
argmin | 求最小值索引 |
argmax | 求最大值索引 |
随机数
函数 | 功能 |
---|---|
rand | 返回给定维度的随机数组(0到1之间的数) |
randn | 返回给定维度的随机数组 |
randint | 返回给定区间的随机整数 |
choice | 给定的一维数组中随机选择 |
shuffle | 原列表上将元素打乱(与random.shuffle相同) |
uniform | 给定形状产生随机数组 |
seed | 设定随机种子(使相同参数生成的随机数相同) |
standard_normal | 生成正态分布的随机样本数 |
参考链接
https://www.cnblogs.com/xiaoyuanqujing/articles/11647031.html