科学计算库Numpy（1）

Numpy

一，数据结构

数据类型： ndarray

import numpy
world_alchol = numpy.genfromtxt('world_alchol.txt',delimiter=',',dtype=str)
print(type(world_alchol))
print(world_alchol)
print(help(numpy.genfromtxt))

创建一维的数组：

vector = numpy.array([5,10,15,20])

创建二维的数组：

matrix = numpy.array([[5,10,15,20],[15,20,25,30]])

查看数据的结构：

vector.shape ------- (4,) 一行四列

matrix.shape ------- (2,4) 两行四列

在numpy.array中的数据类型是限定的，必须是一种数据结构；

数字，string，浮点数等等...

通过索引获取数组的值，行和列的开始都是0开始；

vector[2,] 的值是15；

matrix[1,2] 的值是25；

想取数组的某一列；

matrix[:,2] 的值是15 ，25

如果取两列的话；

matrix[:,0:2] 的值是：array([[ 5, 10],[15, 20]])

判断一个值是否在，返回值是bool类型；

vector == 10 ；返回：array([False, True, False, False])

matrix == 25；返回：array([[False, False, False, False], [False, False, True, False]])

把bool类型的值当成索引返回当前的值；

print(equal_to_ten) ----> [False True False False]

print(vector[equal_to_ten]) ----> [10] 当成索引返回数组中的值；

second_column_25 = (matrix[:,2] == 25

print(second_column_25) ----》 [False True] ；有一行返回true ，说明这行有25的值；

print(matrix[second_column_25,:]) --》[[15 20 25 30]] 返回第二行数组；（second_column_25是行的索引）

二，矩阵常用操作；

b = np.arange(3)

print(b)

print(np.exp(b))

print(np.sqrt(b)) 根号

a = np.floor(10*np.random.random((3,4)))

print(a)

正常情况下向量a.shape查看数据的结构，但是矩阵可以用a.revel()把值给拉平了（变成列表）向量；

print(a.ravel())

a.shape也可以进行其他的组合,变化数组的结构；

a.shape = (6,2)

a.shape = (1,12)

a.T也可以进行转置（行和列变化）；

a.reshape(3,-1) 可以变成3行，n列； -1 代表不要计算取多少列的值，a.reshape(3,-1)可以直接计算；

矩阵拼接：

np.hstack(a,b) 可以进行横向数据拼接；np.vstack(a,b) 可以进行横向数据拼接；

a = np.floor(10*np.random.random((2,2))) print(a)

b = np.floor(10*np.random.random((2,2))) print(b)

print(np.hstack(a,b)) ； print(np.vstack(a,b))

矩阵切分：

np.hsplit(a,3) 把a矩阵切横向分成3份；但是也可以传入元组进行指定切分np.hsplit(a,(3,4)) 把切的元素单独分出 ;

a.np.floor(10*np.random.random((2,12))) print(a)

print(np.hsplit(a,3)) ; print(np.hsplit(a,(3,4)))

np.vsplit(a,3) 把矩阵a纵向切分成3份；

不同复制操作对比：

(1) a = np.arange(12) ; b = a; print(bi is a) ; b.shape = 3,4 ; print(a.shape) ; print(a);print(b);

说明a和b的值是相等的；

(2) c = a.view() ; print(c is a); c.shape = 2,6 ; c[0,4] = 1234; print(a); print(id(a));print(id(c));

c是a的浅复制；c和a的id是并不相等的；他们公用了一套值；

(3) 即让他的id 不同，值也不同；

d = a.copy() --- 深复制 ; d is a ; d[0,0]=999 ; print(d) ; print(a) ;

数据索引

data = np.sin(np.arange(20)).reshape(5,4) ; print(data) ;

ind = data.argmax(axis=0) -- axis按列算；哪个列是最大的值；print(ind)返回的是索引值；

data_max = data[ind. range(data.shape[1])] ;

print(data_max) ; 输出列最大值列表；

列扩展数据：

a = np.arange(0, 40, 10) ; print(a) ; b = np.tile(a , (3,5)) ; print(b)对列进行扩展；

对数组排序；

a = np.arrar([[4, 3, 5],[1, 2, 1]]) ; print(a) ; b = np.sort(a, axis=1) ; print(b) ;

a.sort(axis=1) ;print(a) ; a = np.array([4,3,1,2]) ; j = np.argsort(a) 求索引 ; print(j) ; print(a[j])

posted on 2018-09-03 22:41 微子天明阅读(119) 评论(0) 编辑收藏举报

刷新页面返回顶部

微子天明

科学计算库Numpy（1）

公告

导航