numpy中的ndarray与pandas中的series、dataframe的转换

一个ndarray是一个多维同类数据容器。每一个数组有一个dtype属性,用来描述数组的数据类型。

Series是一种一维数组型对象,包含了一个值序列,并且包含了数据标签----索引(index)。

DataFrame每一列可以是不同类型,即有行索引,又有列索引,可以被是为一个共享相同索引的Series字典。尽管DataFrame是二维的,但可以利用分层索引在DataFrame中展现更高维度的数据。

一、Series、DataFrame---->narray

1)pd.values

In [134]: arr1                                                                 
Out[134]: 
      a  b  c
a1  100  1  1
b2   10  2  2

In [135]: arr1.values                                                          
Out[135]: 
array([[100,   1,   1],
       [ 10,   2,   2]])

2)np.array(pd)

In [140]: np.array(arr1)                                                       
Out[140]: 
array([[100,   1,   1],
       [ 10,   2,   2]])

3)pd.as_matrix()

In [138]: arr1.as_matrix()                                                     
/usr/local/bin/ipython:1: FutureWarning: Method .as_matrix will be removed in a future version. Use .values instead.
  #!/usr/bin/python3
Out[138]: 
array([[100,   1,   1],
       [ 10,   2,   2]])

第三种方式会被remove就用第一二种吧

二、narray---->Series、DataFrame

In [161]: arr3                                                                 
Out[161]: array([0, 1, 2, 3])

In [162]: pd.Series(arr3,index=['a','b','c','d'])                              
Out[162]: 
a    0
b    1
c    2
d    3
dtype: int64

In [163]: pd.DataFrame(arr3,index=['a','b','c','d'])                           
Out[163]: 
   0
a  0
b  1
c  2
d  3

 

posted @ 2019-03-29 14:45  西瓜草莓甘蔗  阅读(15902)  评论(0编辑  收藏  举报