02 2022 档案

摘要:Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析“三剑客之一”的盛名(NumPy、Matplotlib、Pandas)。是学习数据分析、AI机器学习必学组件之一。 Pandas 这个名字来源于面板数据(Panel Data) 阅读全文
posted @ 2022-02-23 10:18 xiejava 阅读(12) 评论(0) 推荐(0) 编辑
摘要:一图胜千言,将信息可视化(绘图)是数据分析中最重要的工作之一。它除了让人们对数据更加直观以外,还可以帮助我们找出异常值、必要的数据转换、得出有关模型的想法等等。pandas 在数据分析、数据可视化方面有着较为广泛的应用。本文将通过实例介绍pandas的数据绘图。 pandas的数据可视化依赖于mat 阅读全文
posted @ 2022-02-16 11:28 xiejava 阅读(32) 评论(0) 推荐(0) 编辑
摘要:在数据分析的过程中,分析师常常希望通过多个维度多种方式来观察分析数据,重塑和透视是常用的手段。 数据的重塑简单说就是对原数据进行变形,为什么需要变形,因为当前数据的展示形式不是我们期望的维度,也可以说索引不符合我们的需求。对数据的重塑不是仅改变形状那么简单,在变形过程中,数据的内在数据意义不能变化, 阅读全文
posted @ 2022-02-14 00:27 xiejava 阅读(69) 评论(0) 推荐(0) 编辑
摘要:在数据分析过程中,经常会需要根据某一列或多列把数据划分为不同的组别,然后再对其进行数据分析。本文将介绍pandas的数据分组及分组后的应用如对数据进行聚合、转换和过滤。 在关系型数据库中我们常用SQL的GROUP BY操作进行分组分析计算。在pandas中要完成数据的分组操作同样可用groupby( 阅读全文
posted @ 2022-02-12 09:52 xiejava 阅读(46) 评论(0) 推荐(0) 编辑
摘要:在许多应用中,数据可能来自不同的渠道,在数据处理的过程中常常需要将这些数据集进行组合合并拼接,形成更加丰富的数据集。pandas提供了多种方法完全可以满足数据处理的常用需求。具体来说包括有join、merge、concat、append等。 一般来说 方法说明join最简单,主要用于基于索引的横向合 阅读全文
posted @ 2022-02-10 12:44 xiejava 阅读(27) 评论(0) 推荐(0) 编辑
摘要:对于数据分析来说,在构造或载入数据后最基本的操作应该就是对数据的访问了。看一看数据的结构、组成、分布等,根据需要从数据集中检索提取出相应的数据。pandas作为数据分析的利器,当然提供了多种查看和检索数据的方法。本文就来捋一捋pandas基本的数据访问。 一、查看数据 当我们拿到数据集后,第一步可能 阅读全文
posted @ 2022-02-07 23:36 xiejava 阅读(82) 评论(0) 推荐(0) 编辑
摘要:我们在数据处理的过程中经常碰到需要对数据进行转换的工作,比如将原来数据里的字典值根据字典转义成有意义的说明,将某些数据转换成其他的数据,将空值转换成其他值,将数据字段名进行重命名等。pandas作为数据处理分析的利器当然为上述的这些数据转换提供了便捷的方法。我们可以利用pandas提供的映射、替换、 阅读全文
posted @ 2022-02-04 21:58 xiejava 阅读(83) 评论(0) 推荐(1) 编辑
摘要:数据分析离不开数据运算,在介绍完pandas的数据加载、排序和排名、数据清洗之后,本文通过实例来介绍pandas的常用数据运算,包括逻辑运算、算术运算、统计运算及自定义运算。 一、逻辑运算 逻辑运算是程序代码中经常用到的一种运算。pandas的逻辑运算与Python基础语法中的逻辑运算存在一些差异。 阅读全文
posted @ 2022-02-03 13:01 xiejava 阅读(81) 评论(0) 推荐(0) 编辑
摘要:在数据分析和建模的过程中,有相当多的时间要用在数据准备上:加载、清理、转换以及重塑。这些工作会占到分析师时间的80%或更多。幸运的是pandas和内置的Python标准库提供了高效、灵活的工具可以帮助我们轻松的做这些事情。 本文重点介绍通过pandas进行数据的清洗。数据处理中的清洗工作主要包括对需 阅读全文
posted @ 2022-02-02 00:21 xiejava 阅读(161) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示