随笔分类 - Pandas学习
摘要:pandas目录 “去重”通过字面意思不难理解,就是删除重复的数据。在一个数据集中,找出重复的数据删并将其删除,最终只保存一个唯一存在的数据项,这就是数据去重的整个过程。删除重复数据是数据分析中经常会遇到的一个问题。通过数据去重,不仅可以节省内存空间,提高写入性能,还可以提升数据集的精确度,使得数据
阅读全文
摘要:pandas目录 1 简介 Pands 提供了两种排序方法,分别是按标签排序和按数值排序。本节讲解 Pandas 的排序操作。 下面创建一组 DataFrame 数据,如下所示: df = pd.DataFrame({'b':[1,2,3,2], 'a':[4,3,2,1], 'c':[1,3,8,
阅读全文
摘要:pandas目录 1 简介 对于 Series 而言,您可以把它当做一维数组进行遍历操作;而像 DataFrame 这种二维数据表结构,则类似于遍历 Python 字典。 示例:对于 Series 循环 s = pd.Series(data=np.arange(5),index=['rank'+st
阅读全文
摘要:pandas目录 1 简介 重置索引(reindex)可以更改原 DataFrame 的行标签或列标签,并使更改后的行、列标签与 DataFrame 中的数据逐一匹配。通过重置索引操作,您可以完成对现有数据的重新排序。如果重置的索引标签在原 DataFrame 中不存在,那么该标签对应的元素值将全部
阅读全文
摘要:pandas目录 1 Lesson1——Pandas是什么 2 Lesson2——Pandas库下载和安装 3 Lesson3——Pandas Series结构 4 Lesson4——Pandas DataFrame结构 5 Lesson5——Pandas Panel三维数据结构 6 Lesson6
阅读全文
摘要:pandas目录 简介 如果想要应用自定义的函数,或者把其他库中的函数应用到 Pandas 对象中,有以下三种方法: 操作整个 DataFrame 的函数:pipe() 操作行或者列的函数:apply() 操作单一元素的函数:applymap() 下面介绍了三种方法的使用。 1 操作整个数据表 通过
阅读全文
摘要:pandas目录 1 简介 描述统计学(descriptive statistics)是一门统计学领域的学科,主要研究如何取得反映客观现象的数据,并以图表形式对所搜集的数据进行处理和显示,最终对数据的规律、特征做出综合性的描述分析。 下列表格对 Pandas 常用的统计学函数做了简单的总结: 函数名
阅读全文
摘要:pandas目录 1 简介 自 Pandas 0.25 版本后, Panel 结构已经被废弃。 pd.__version__ #查看pandas版本 #'1.2.4' #或者 pd.show_versions() Panel 结构也称“面板结构”,源自于 Panel Data 一词,翻译为“面板数据
阅读全文
摘要:pandas目录 思维导图 1 简介 DataFrame 是 Pandas 的重要数据结构之一,也是在使用 Pandas 进行数据分析过程中最常用的结构之一。 2 认识DataFrame结构 DataFrame 一个表格型的数据结构,既有行标签(index),又有列标签(columns),它也被称异
阅读全文
摘要:pandas目录 思维导图 1 什么是Series结构? Series 结构,也称 Series 序列,是 Pandas 常用的数据结构之一,它是一种类似于一维数组的结构,由一组数据值(value)和一组标签组成,其中标签与数据值之间是一一对应的关系。 Series 可以保存任何数据类型,比如整数、
阅读全文
摘要:pandas目录 简介 Python 官方标准发行版并没有自带 Pandas 库,因此需要另行安装。除了标准发行版外,还有一些第三方机构发布的 Python 免费发行版, 它们在官方版本的基础上开发而来,并有针对性的提前安装了一些 Python 模块,从而满足某些特定领域的需求,比如专门适应于科学计
阅读全文
摘要:pandas目录 一、简介 Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析“三剑客之一”的盛名(NumPy、Matplotlib、Pandas)。Pandas 已经成为 Python 数据分析的必备高级工具,它的目标是成为
阅读全文