利用pandas进行数据分析之ndarray结构

Numpy的重要特点就是其N维数组对象,

1、ndarray每个元素是相同的,每个数组都有一个两个对象:

.shape:用于表示维度大小的元组

.dtype:用户表示数组类型的对象

2、创建数组

array(将输入数据(列表、元组、数组或其他序列类型)转化为ndarray)

array ([[列表1],[列表2],...],dtpye=np.int)

array((元组1,元组2,...))

np.zeros(10),np.ones((n,m)),np.empty((m,n,w))

np.arange(n):arange是python内置函数range的数组版,np.arange(32).reshape((8,4))

np.random中的randn函数生成一些正态分布的随机数据,random.rand(m,n),m*n维的正态分布数据

np.random.normal(size=(4,4))#得到一个标准整体分布4*4样本数组

 

3、数组运算

3.1数组之间的任何算数运算都会将运算应用到元素级

3.2索引和切片:跟列表区别是,数组切片是原始数组的视图,意味着数组不会被复制,视图上的任何修改都会直接反映到元数据组上。

arr[0][2] 与arr[0,2]是等价的,arr[:,:2],冒号表示选取整个轴,表示所有行,第一列和第二列

arr[布尔型]:选TRUE的行

arr[arr>6] 

arr.T:转置

4、数据加载

除了pandas中的read_csv和read_table函数,np.loadtxt或np.genfromtxt将数据加载到普通的

Numpy数组中

例:np.load('filename.txt',delimiter=',')

 

 

posted @ 2016-09-06 16:12  水晶球  阅读(1809)  评论(0编辑  收藏  举报