摘要: pandas可以读写如下格式的数据类型: 具体详见:http://pandas.pydata.org/pandas docs/version/0.20/io.html 读取csv文件 我们准备了一个csv文件,格式类似为: 要读取此csv文件,方法为: 输出为: 这里我第一次尝试运行时,由于没有设置 阅读全文
posted @ 2017-11-23 09:17 dreampursuer 阅读(1238) 评论(0) 推荐(0) 编辑
摘要: 假设我们的数据集中有缺失值,该如何进行处理呢? 丢弃缺失值的行或列 首先我们定义了数据集的缺失值: 这里缺失值用np.nan来设置,输出为: 丢弃缺失值数据 可以使用dropna函数把拥有缺失值数据的行或列进行丢弃。 我们这里以丢弃掉拥有缺失值行作为例子: 输出为: 这样把拥有NaN的2017 01 阅读全文
posted @ 2017-11-22 11:27 dreampursuer 阅读(392) 评论(0) 推荐(0) 编辑
摘要: 本节主要讲述如何根据上篇博客中选择出相应的数据之后,对其中的数据进行修改。 对某个值进行修改 例如,我们想对数据集中第2行第2列的数据进行修改: 输出为: 根据筛选条件设置值 比如,我们想对数据集中B列大于14的数据设置为14值,类似SQL中的: update table set B = 14 wh 阅读全文
posted @ 2017-11-21 10:09 dreampursuer 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 选择列 根据列名来选择某列的数据 输出结果: 也可以用点符号来进行: 上面的功能跟data["A"]一样。 选择某几行数据 输出为: 也可以根据索引号范围来选择某几行的数据。 比如,如下的例子中我们就选择出2017 01 10到2017 01 12的数据: 输出为: 使用loc进行选择 使用loc选 阅读全文
posted @ 2017-11-20 08:15 dreampursuer 阅读(500) 评论(0) 推荐(0) 编辑
摘要: 前面我们学习了numpy,现在我们来学习一下pandas。 Python Data Analysis Library 或 pandas 主要用于处理类似excel一样的数据格式,其中有表头、数据序列号以及实际的数据,而numpy就仅仅包含了实际的数据。 安装 直接输入: 最基本用法 输出: 我们可以 阅读全文
posted @ 2017-11-19 10:46 dreampursuer 阅读(1106) 评论(0) 推荐(0) 编辑
摘要: 对象的引用 看例子: 运行结果: 上面的例子中,我们改变了a的值,但打印出来b中的值也被修改了,原因是a和b指向相同的对象。 复制 如果我们想要解决修改了a的值不会影响到b中的值,该如何做到呢? 输出为: 阅读全文
posted @ 2017-11-18 09:38 dreampursuer 阅读(4688) 评论(0) 推荐(0) 编辑
摘要: 有合并,就有分割。 本节主要讲述如何通过numpy对数组进行横向/纵向分割。 横向/纵向分割数组 首先创建一个6行4列的数组,然后我们对此数组按照横向进行切割,分成3块,这样每块应该有2行,见例子: 输出为: 上面的分割中把数组分成了等分的3份,如果我们不想分割成等分的,可以写成如下的方式: 输出为 阅读全文
posted @ 2017-11-17 07:47 dreampursuer 阅读(2016) 评论(0) 推荐(0) 编辑
摘要: 概述 本节主要讲述如何把两个数组按照行或列进行合并。 按行进行上下合并 例如: 合并后输出结果为: 按列左右合并 左右合并后,输出为: 使用concatenate合并 输出为: 添加维度 比如,我们有一个一维的数组,现在我们想要对这个一维数组增加一个维度,变成2维数组,该怎么做呢? 例如:[1, 2 阅读全文
posted @ 2017-11-16 09:49 dreampursuer 阅读(1010) 评论(0) 推荐(0) 编辑
摘要: 简单的索引值 输出为: 对于获取第2行第3列的数据,我们还可以用如下的方式来获取: 数据切片 用冒号索引可以对数据进行切片。 输出为: 上面用冒号来对数据选择进行了占位。 如果我们想要获得第1列的所有数: 输出为第1列的所有数: 获取第1行从第2列到第4列的值: 输出为: 把数据变平 把数据变平的意 阅读全文
posted @ 2017-11-15 08:29 dreampursuer 阅读(334) 评论(0) 推荐(0) 编辑
摘要: numpy的基础运算中还有很多运算,我们这里再记录一些。 最小/大值索引 前面一篇博文中我们讲述过如何获得数组中的最小值,这里我们获得最小/大值的索引值,也就是这个最小/大值在整个数组中位于第几位。 输出为: 这就意味着这里最小值的索引号是4,也就是数组中第4位的值,也就是数值5。 平均值 输出为: 阅读全文
posted @ 2017-11-14 08:27 dreampursuer 阅读(378) 评论(0) 推荐(0) 编辑