摘要:
说明 数据清洗是对一些没有用的数据进行处理的过程。 很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况,如果要对使数据分析更加准确,就需要对这些没有用的数据进行处理。 在这个教程中,我们将利用 Pandas包来进行数据清洗。 本文使用到的测试数据 property-data.csv 如下 阅读全文
摘要:
JSON(JavaScript Object Notation,JavaScript 对象表示法),是存储和交换文本信息的语法,类似 XML。 Pandas 可以很方便的处理 JSON 数据。 读取JSON数据 假设site.json文件内容如下: [ { "id": "A001", "name": 阅读全文
摘要:
1. 定义 CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。 Pandas 可以很方便的处理 CSV 文件,本文 阅读全文
摘要:
1. 定义 DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。 2. 构造方法 pandas.DataFrame( data, ind 阅读全文