9月26日总结

Pandas 对象(Index (opens new window), Series (opens new window), DataFrame (opens new window))相当于数组的容器,用于存储数据、执行计算。大部分类型的底层数组都是 numpy.ndarray (opens new window)。不过,Pandas 与第三方支持库一般都会扩展 NumPy 类型系统,添加自定义数组(见数据类型 (opens new window))。

.array 属性用于提取 Index (opens new window)或 Series (opens new window)里的数据。

In [10]: s.array
Out[10]: 
<PandasArray>
[ 0.4691122999071863, -0.2828633443286633, -1.5090585031735124,
 -1.1356323710171934,  1.2121120250208506]
Length: 5, dtype: float64

In [11]: s.index.array
Out[11]: 
<PandasArray>
['a', 'b', 'c', 'd', 'e']
Length: 5, dtype: object

array (opens new window)一般指 ExtensionArray (opens new window)。至于什么是 ExtensionArray (opens new window)及 Pandas 为什么要用 ExtensionArray (opens new window)不是本节要说明的内容。更多信息请参阅数据类型 (opens new window)

提取 NumPy 数组,用 to_numpy() (opens new window)或 numpy.asarray()

In [12]: s.to_numpy()
Out[12]: array([ 0.4691, -0.2829, -1.5091, -1.1356,  1.2121])

In [13]: np.asarray(s)
Out[13]: array([ 0.4691, -0.2829, -1.5091, -1.1356,  1.2121])
posted @ 2021-09-26 20:37  不详·Christina  阅读(25)  评论(0编辑  收藏  举报