08 2020 档案
摘要:本章重点内容: 1、分层索引 2、联合与合并数据集 3、重塑和透视 接下来分别详细说明 1、分层索引 分层索引是pandas的重要特性,先看一个分层结构的数据,如下: 通过分层索引,可以简洁的选择出数据的子集,如下: 既然是分层索引,不仅仅局限在外层索引,还可以通过”内层“进行选择,如下: 分层索引
阅读全文
摘要:本章重点内容: 1、处理缺失值 2、数据转换 3、字符串操作 接下来展开详细的说明 1、处理缺失值 缺失值是在处理数据过程经常遇到的情况,对于缺失值的处理,大概有两个方向,一个是过滤缺失值,一个是补全缺失值 过滤缺失值 用到的方法是dropna,具体代码示例如下: 如果是DataFrame对象,dr
阅读全文
摘要:重点内容: 1、文本格式数据的读写 2、二进制格式 接下来展开说明,如下: 1、文本格式数据的读写 首先,看一个简单的文件,文件内容是逗号分割文本文件(CSV),通过read_CSV来读取文件,如下: 特别要说明,该文件的位置,要和你操作软件默认的位置一样,否则要用完整的地址目录 也可以通过read
阅读全文
摘要:本章重点内容: 1、pandas 数据结构介绍 2、基本功能 3、描述性统计的概述与计算 接下来展开详细的说明 1、pandas 数据结构介绍 Series数据 Series是一种一维的数组型对象,它包含了一个值序列,并且包含了数据标签,成为索引(index), 最简单的序列可以仅仅由一个数组形成,
阅读全文

浙公网安备 33010602011771号