随笔分类 -  Pandas

摘要:一、文本文件 1.pandas.read_csv() 可以读取文本文件(.csv 格式): pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None 阅读全文
posted @ 2019-12-27 17:31 nxf_rabbit75 阅读(715) 评论(0) 推荐(0) 编辑
摘要:1.时间序列的移动窗口上的各种统计函数是一种常见的操作。这一类函数我们称作移动窗口函数 与其他统计函数一样,移动窗口函数也排除了NA值 所谓移动窗口,就是两层含义: 窗口:统计函数作用的对象为该窗口内的数值 移动:该窗口是移动的,每个窗口对应一个统计量 。最终生成一个统计量序列 2.计算移动窗口的平 阅读全文
posted @ 2019-12-27 17:27 nxf_rabbit75 阅读(474) 评论(0) 推荐(0) 编辑
摘要:1.matplotlib是一种比较低级的工具,pandas中有许多利用DataFrame对象数据组织特点来创建标准图表的高级绘图方法。 2.Series/DataFrame.plot():绘制图形。 Series.plot(kind='line', ax=None, figsize=None, us 阅读全文
posted @ 2019-12-27 17:26 nxf_rabbit75 阅读(1010) 评论(0) 推荐(0) 编辑
摘要:1. Python 中的时间 1.1 时区 1.2 time 模块 1.3 datetime 模块 2. 时间点 Timestamp 3. 时间段 Period 4. DatetimeIndex 5. PeriodIndex 6. resample 和频率转换 阅读全文
posted @ 2019-12-27 17:22 nxf_rabbit75 阅读(239) 评论(0) 推荐(0) 编辑
摘要:一、分组 1.分组运算的过程为:拆分-应用-合并 拆分阶段:Series/DataFrame等数据根据你提供的一个或者多个键,被拆分为多组 应用阶段:根据你提供的一个函数应用到这些分组上 合并阶段:将函数的执行结果合并到最终结果中 2.分组中有两种数据:源数据(被分组的对象),分组数据(用于划分源数 阅读全文
posted @ 2019-12-27 17:21 nxf_rabbit75 阅读(152) 评论(0) 推荐(0) 编辑
摘要:1.Series.map 通过Series.map()方法,所有字符串和正则表达式方法都能应用于各个值。但是如果存在NaN就会报错。为了解决这个问题,pandas提供了一些能够跳过NaN值的字符串操作方法。 2.Series.str.ufunc Series.str能够将Series的值当作字符串处 阅读全文
posted @ 2019-12-27 17:19 nxf_rabbit75 阅读(248) 评论(0) 推荐(0) 编辑
摘要:一、移除重复数据 1.Series/DataFrame.duplicated Series/DataFrame.duplicated(*args, **kwargs) 返回一个布尔Series,指示调用者中,哪些行是重复的(重复行标记为True)。 参数: keep:一个字符串或者False,指示如 阅读全文
posted @ 2019-12-27 17:18 nxf_rabbit75 阅读(337) 评论(0) 推荐(0) 编辑
摘要:一、索引和轴的变换 1.重新索引:reindex 1 Series/DataFrame.reindex(index=None, **kwargs): 参数: index:一个array-like对象,给出了新的index的label method:当新的label的值缺失时,如何处理。参数值可以为: 阅读全文
posted @ 2019-12-27 17:17 nxf_rabbit75 阅读(365) 评论(0) 推荐(0) 编辑
摘要:一、数值运算 1.当进行数值运算时,pandas会按照标签对齐元素:运算符会对标签相同的两个元素进行计算。对于DataFrame,对齐会同时发生在行和列上。 当某一方的标签不存在时,默认以NaN填充。缺失值会在运算过程中传播。(由于NaN是浮点数中的一个特殊值,因此结果的元素类型被转换为float6 阅读全文
posted @ 2019-12-27 17:16 nxf_rabbit75 阅读(328) 评论(0) 推荐(0) 编辑
摘要:一、[ ] 操作符 1.Index 对于Index对象,可以通过[]来选取数据,它类似于一维ndarray的索引。下标可以为下列几种下标对象: 一个整数下标。此时返回对应的label 一个整数slice。此时返回对应的Index(根据一维labels先切片,再组装成Index) 一个array-li 阅读全文
posted @ 2019-12-27 17:15 nxf_rabbit75 阅读(1209) 评论(0) 推荐(0) 编辑
摘要:(实线为普通属性,虚线为property属性或者getset_descriptor) 1.Index的结构 .name为普通属性,返回Index的名字 .values/._values为property属性,返回Index的内部数据的视图 ._data为普通属性,返回Index的内部数据 .shap 阅读全文
posted @ 2019-12-27 17:14 nxf_rabbit75 阅读(803) 评论(0) 推荐(1) 编辑
摘要:一、Series 1.创建 (1)方法一 class pandas.Series(data=None, index=None, dtype=None, name=None, copy=False,fastpath=False) 参数: data:它可以是一个字典、array-like、标量。表示Se 阅读全文
posted @ 2019-12-27 17:12 nxf_rabbit75 阅读(736) 评论(0) 推荐(0) 编辑
摘要:或者写在一行 参考文献: 【1】pandas 显示不全问题 阅读全文
posted @ 2019-07-03 18:59 nxf_rabbit75 阅读(1766) 评论(0) 推荐(0) 编辑
摘要:引入工具包 总览 一.datetime库 datetime标准库有四个主要对象 时间 - 仅限时间,以小时,分钟,秒和微秒为单位日期 - 仅年,月和日datetime - 时间和日期的所有组成部分timedelta - 最大天数的时间量 (1)datetime创建 (2)datetime转Times 阅读全文
posted @ 2019-06-30 23:46 nxf_rabbit75 阅读(32574) 评论(1) 推荐(8) 编辑
摘要:原数据:int型 转成年月日 时分秒的形式 阅读全文
posted @ 2019-06-27 16:54 nxf_rabbit75 阅读(557) 评论(0) 推荐(0) 编辑
摘要:https://stackoverflow.com/questions/38741952/how-to-convert-data-of-type-panda-to-panda-dataframe 阅读全文
posted @ 2019-06-25 14:15 nxf_rabbit75 阅读(290) 评论(0) 推荐(0) 编辑
摘要:https://www.jianshu.com/p/312c4586346d 阅读全文
posted @ 2019-06-25 13:53 nxf_rabbit75 阅读(660) 评论(0) 推荐(0) 编辑
摘要:https://blog.csdn.net/ls13552912394/article/details/79349809 https://tracholar.github.io/wiki/python/pandas.html 阅读全文
posted @ 2019-06-19 09:10 nxf_rabbit75 阅读(800) 评论(0) 推荐(0) 编辑
摘要:cum系列函数是作为DataFrame或Series对象的方法出现的,因此命令格式为D.cumsum() 举例: 1. cumsum 2. cumprod 3. cummax 4. cummin 参考文献: 【1】Pandas —— cum累积计算和rolling滚动计算 阅读全文
posted @ 2019-04-08 11:39 nxf_rabbit75 阅读(3756) 评论(0) 推荐(1) 编辑
摘要:六、移动窗口函数 移动窗口和指数加权函数类别如↓: rolling_mean 移动窗口的均值 pandas.rolling_mean(arg, window, min_periods=None, freq=None, center=False, how=None, **kwargs) rolling 阅读全文
posted @ 2019-04-08 11:29 nxf_rabbit75 阅读(18639) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示