摘要:
Pandas 数据清洗 数据清洗是对一些没有用的数据进行处理的过程。 很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况,如果要对使数据分析更加准确,就需要对这些没有用的数据进行处理。 在这个教程中,我们将利用 Pandas包来进行数据清洗。 本文使用到的测试数据 property-da 阅读全文
摘要:
Pandas JSON JSON(JavaScript Object Notation,JavaScript 对象表示法),是存储和交换文本信息的语法,类似 XML。 JSON 比 XML 更小、更快,更易解析,更多 JSON 内容可以参考 JSON 教程。 Pandas 可以很方便的处理 JSON 阅读全文
摘要:
Pandas CSV 文件 CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。 Pandas 可以很方便的处理 C 阅读全文
摘要:
Pandas 数据结构 - DataFrame DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。 DataFrame 构造方法如下: 阅读全文
摘要:
Pandas 数据结构 - Series Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。 Series 由索引(index)和列组成,函数如下: pandas.Series( data, index, dtype, name, copy) 参数 阅读全文
摘要:
Python pandas 入门 Pandas 应用 Pandas 的主要数据结构是 Series (一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。 数据结构 Series 是一种类似于一维数组的对象,它由一组数据(各种Num 阅读全文
摘要:
Matplotlib 饼图 我们可以使用 pyplot 中的 pie() 方法来绘制饼图。 pie() 方法语法格式如下: matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistan 阅读全文
摘要:
Matplotlib 柱形图(直方图,柱状图) 我们可以使用 pyplot 中的 bar() 方法来绘制柱形图。 bar() 方法语法格式如下: matplotlib.pyplot.bar(x, height, width=0.8, bottom=None, *, align='center', d 阅读全文
摘要:
Matplotlib 散点图 我们可以使用 pyplot 中的 scatter() 方法来绘制散点图。 scatter() 方法语法格式如下: matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=N 阅读全文
摘要:
Matplotlib 绘制多图 我们可以使用 pyplot 中的 subplot() 和 subplots() 方法来绘制多个子图。 subplot() 方法在绘图时需要指定位置,subplots() 方法可以一次生成多个,在调用时只需要调用生成对象的 ax 即可。 subplot subplot( 阅读全文