摘要:
内容目录 1. 字典式 get 访问 2. 属性访问 3. 切片操作 4. 通过数字筛选行和列 5. 通过名称筛选行和列 6. 布尔索引 7. isin 筛选 8. 通过Callable筛选 数据准备 1. 字典式 get 访问 2. 属性访问 3.切片 切片对于 Series 来说,通过切片可以完 阅读全文
摘要:
内容目录 1. 统计函数 2. 窗口函数 3. 加深加强 数据准备 1.统计函数 最常见的计算工具莫过于一些统计函数了。 这里我们首先构建一个包含了用户年龄与收入的 DataFrame。我们可以通过 cov 函数来求出年龄与收入之间的协方差,计算的时候会丢弃缺失值。除了协方差之外,我们还可以通过 c 阅读全文
摘要:
内容目录 1. 基础概述 2. 转换时间戳 3. 生成时间戳范围 4. DatetimeIndex 5. DateOffset对象 6. 与时间序列相关的方法 6.1 移动 6.2 频率转换 6.3 重采样 在处理时间序列的的过程中,我们经常会去做以下一些任务: 使用 Pandas 可以轻松完成以上 阅读全文
摘要:
内容目录 1. 创建对象 2. 常用操作 3. 内存使用量的陷阱 一、创建对象 1.基本概念:分类数据直白来说就是取值为有限的,或者说是固定数量的可能值。例如:性别、血型。 2.创建分类数据:这里以血型为例,假定每个用户有以下的血型,我们如何创建一个关于血型的分类对象呢? 方法一:明确指定 dtyp 阅读全文
摘要:
内容目录 1. 为什么要用str属性 2. 替换和分割 3. 提取子串 3.1 提取第一个匹配的子串 3.2 匹配所有子串 3.3 测试是否包含子串 3.4 生成哑变量 3.5 方法摘要 3.1 提取第一个匹配的子串 3.2 匹配所有子串 3.3 测试是否包含子串 3.4 生成哑变量 3.5 方法摘 阅读全文
摘要:
内容目录 1. 什么是缺失值 2. 丢弃缺失值 3. 填充缺失值 4. 替换缺失值 5. 使用其他对象填充 数据准备 将出生日期转化为日期类型 一、什么是缺失值? 可以看到,用户 Tom 的性别为 None,用户 Mary 的年龄为 NAN,生日为 NaT。在 Pandas 的眼中,这些都属于缺失值 阅读全文
摘要:
matplotlib基础 一、figure对象 我这里单拿出一个一个的对象,然后后面在进行总结。在matplotlib中,整个图表为一个figure对象。其实对于每一个弹出的小窗口就是一个Figure对象,那么如何在一个代码中创建多个Figure对象,也就是多个小窗口呢? 这里需要注意的是: plt 阅读全文
摘要:
一、初始Series Series 是一个带有 名称 和索引的一维数组,既然是数组,肯定要说到的就是数组中的元素类型,在 Series 中包含的数据类型可以是整数、浮点、字符串、Python对象等。 创建第一个Series 创建第一个Series 创建Series的方式 # 方式一 t = pd.S 阅读全文