Pandas 是一个数据结构

Pandas 的主要数据结构是两种核心对象:Series 和 DataFrame。

  • Series 是一维标记数组,类似于带有标签的数组。它可以存储任何数据类型,并且每个元素都与一个唯一的标签相关联。
  • DataFrame 是二维标记数据结构,类似于电子表格或 SQL 表。它由多个列组成,每列可以是不同的数据类型,可以将 DataFrame 视为一系列 Series 对象的集合。

用途:

处理excel

和numpy的区别:

  nump没索引,pandas有

  1. 数据结构:

    • ndarray是一个多维数组对象,可以包含具有相同数据类型的元素,通常用于进行数值计算和数组操作。它是NumPy库的核心数据结构。
    • DataFramepandas库中的数据结构,它是一个二维标记数据表,类似于电子表格或SQL表。DataFrame可以包含不同数据类型的列,可以方便地处理结构化数据。
  2. 数据类型:

    • ndarray要求所有元素具有相同的数据类型,通常是数值类型(如整数、浮点数)。
    • DataFrame允许每列具有不同的数据类型,因此可以容纳混合数据,包括数值、文本、日期时间等。
  3. 索引:

    • ndarray没有内置的行或列标签,只能通过位置索引来访问元素。
    • DataFrame具有灵活的行和列标签,使数据更容易理解和操作。你可以自定义行和列的标签,还可以使用标签进行数据选择和操作。
  4. 功能:

    • ndarray主要用于执行数学和数组操作,例如加法、乘法、广播等。
    • DataFrame是设计用于数据分析和处理的,它提供了许多功能,如数据过滤、合并、聚合、透视表、时间序列操作等。
  5. 用途:

    • ndarray适用于数值计算、科学计算、机器学习等领域,特别是需要处理大量数值数据的情况。
    • DataFrame更适用于数据探索、数据清洗、数据可视化、数据分析以及结构化数据的存储和操作。它在数据科学和数据分析中广泛使用。

 

posted on   黑逍逍  阅读(157)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!



点击右上角即可分享
微信分享提示