摘要:
缺失数据(missing data)大部分数据分析应用中非常常见。pd设计目标之一就是让缺失数据的处理任务尽量轻松。 pd 使用浮点值NaN(Not a Number) 表示浮点和非浮点数组中的缺失数据。是一个被检测出来的标识 Na处理方法 1、 滤除缺失数据 只用这种方式丢弃列,只需传入axis 阅读全文
摘要:
缺失数据(missing data)大部分数据分析应用中非常常见。pd设计目标之一就是让缺失数据的处理任务尽量轻松。 pd 使用浮点值NaN(Not a Number) 表示浮点和非浮点数组中的缺失数据。是一个被检测出来的标识 Na处理方法 1、 滤除缺失数据 只用这种方式丢弃列,只需传入axis 阅读全文
摘要:
pd对象拥有一组常用的数学和统计方法。大部分都属于约简和汇总统计,用于从Series中单个值,如sum 和 mean 或从DF的行或列中提取一个Series。 1、 描述和汇总统计方法 约简方法的选项 描述和汇总统计方法 2、 相关系数和协方差 有些汇总统计是通过参数对计算出来的 计算百分数变化:. 阅读全文
摘要:
本章介绍pandas的重要功能,只记录一些重点内容 1、重新索引 pandas对象的一个重要方法是reindex,其作用是创建一个适应用新索引的新对象 输出结果 reindex函数的参数 2、丢弃指定轴上的项 丢弃某条轴上的一个或多个项很简单,只要有一个索引数组或列表即可。 drop方法返回的是一个 阅读全文
|