Aric Zeng

极致的高深即是简单——列奥纳多.达.芬奇

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2017年9月7日

摘要: 缺失数据(missing data)大部分数据分析应用中非常常见。pd设计目标之一就是让缺失数据的处理任务尽量轻松。 pd 使用浮点值NaN(Not a Number) 表示浮点和非浮点数组中的缺失数据。是一个被检测出来的标识 Na处理方法 1、 滤除缺失数据 只用这种方式丢弃列,只需传入axis 阅读全文
posted @ 2017-09-07 17:28 一阵风,静! 阅读(522) 评论(0) 推荐(0) 编辑

摘要: pd对象拥有一组常用的数学和统计方法。大部分都属于约简和汇总统计,用于从Series中单个值,如sum 和 mean 或从DF的行或列中提取一个Series。 1、 描述和汇总统计方法 约简方法的选项 描述和汇总统计方法 2、 相关系数和协方差 有些汇总统计是通过参数对计算出来的 计算百分数变化:. 阅读全文
posted @ 2017-09-07 13:44 一阵风,静! 阅读(476) 评论(0) 推荐(0) 编辑

摘要: 本章介绍pandas的重要功能,只记录一些重点内容 1、重新索引 pandas对象的一个重要方法是reindex,其作用是创建一个适应用新索引的新对象 输出结果 reindex函数的参数 2、丢弃指定轴上的项 丢弃某条轴上的一个或多个项很简单,只要有一个索引数组或列表即可。 drop方法返回的是一个 阅读全文
posted @ 2017-09-07 12:22 一阵风,静! 阅读(405) 评论(0) 推荐(0) 编辑