利用pandas进行数据分析之ndarray结构

Numpy的重要特点就是其N维数组对象，

1、ndarray每个元素是相同的，每个数组都有一个两个对象：

.shape:用于表示维度大小的元组

.dtype：用户表示数组类型的对象

2、创建数组

array(将输入数据（列表、元组、数组或其他序列类型）转化为ndarray)

array ([[列表1]，[列表2]，...]，dtpye=np.int）

array（(元组1，元组2，...)）

np.zeros(10),np.ones((n,m)),np.empty((m,n,w))

np.arange(n):arange是python内置函数range的数组版，np.arange(32).reshape((8,4))

np.random中的randn函数生成一些正态分布的随机数据，random.rand(m,n),m*n维的正态分布数据

np.random.normal(size=(4,4))#得到一个标准整体分布4*4样本数组

3、数组运算

3.1数组之间的任何算数运算都会将运算应用到元素级

3.2索引和切片：跟列表区别是，数组切片是原始数组的视图，意味着数组不会被复制，视图上的任何修改都会直接反映到元数据组上。

arr[0][2] 与arr[0,2]是等价的，arr[:,:2],冒号表示选取整个轴，表示所有行，第一列和第二列

arr[布尔型]：选TRUE的行

arr[arr>6]

arr.T:转置

4、数据加载

除了pandas中的read_csv和read_table函数，np.loadtxt或np.genfromtxt将数据加载到普通的

Numpy数组中

例：np.load('filename.txt',delimiter=',')

posted @ 2016-09-06 16:12 水晶球阅读(1882) 评论(0) 收藏举报

刷新页面返回顶部

水晶球