摘要: 读取一列的时间时间,并且可以直接读取时间数据对应的年、日、小时、秒 data['Time']=pd.to_datetime(data['Time'],format='%Y-%m-%d'), 后面的format可加可不加,如果时完整的年月日时分秒,则不需要加格式化。 data['year']=data 阅读全文
posted @ 2020-07-21 23:54 飞哥霸气 阅读(2483) 评论(0) 推荐(0) 编辑
摘要: 用pandas时一直是读取的现有数据,以至于一直也没有掌握从0-1创建DataFrame的操作,看到这篇文章总结的很好,学习的同时记录一下; 感谢博主 蒙面的普罗米修斯的分享,原博链接如下:https://www.cnblogs.com/datasnail/p/9675410.html 阅读全文
posted @ 2020-05-14 10:43 飞哥霸气 阅读(523) 评论(0) 推荐(0) 编辑
摘要: 对Dataframe运用函数时,一般有两种方法, 1、data.apply(lambda X: fun(X[列名1],X[列名2]),axis=1),即为将该两列运用自定义函数; 2、data[’新列名']=data['列名'].apply(fun) 最近处理函数时,发现有时定义函数,需要运用函数外 阅读全文
posted @ 2020-05-13 15:42 飞哥霸气 阅读(2099) 评论(0) 推荐(0) 编辑
摘要: 最近看文章,看到了类似遍历字典键值对的方式遍历Dataframe中的所有行,记一下。 阅读全文
posted @ 2020-05-13 15:10 飞哥霸气 阅读(2312) 评论(0) 推荐(0) 编辑
摘要: 感谢博主shangyj17的分享,原文章链接位置:https://www.jb51.net/article/169635.htm 1.找出含有空值的行: 阅读全文
posted @ 2020-05-11 15:47 飞哥霸气 阅读(2219) 评论(0) 推荐(0) 编辑
摘要: 转载于博主flash胜龙的文章,感谢博主的总结与分享。 原博客链接https://blog.csdn.net/u010770993/article/details/70312506 一、选取几列组成新的dataframe: df = df[['A列列名', 'S列列名', 'H列列名']] 二、选取 阅读全文
posted @ 2020-04-24 13:44 飞哥霸气 阅读(18578) 评论(0) 推荐(0) 编辑
摘要: 在ArcGIS字段计算器中,VB脚本的格式要求很随意,而Python的格式要求非常严格。 但Python的语言要更加方便,可以增加一些复杂的运算公式,自定义公式等。自己在运用过程中发现两个需要注意的地方(不一定权威),记录一下,也可以避免大家入坑(因为么有调试的功能,不容易发现问题到底出现在什么地方 阅读全文
posted @ 2020-02-10 16:45 飞哥霸气 阅读(2105) 评论(0) 推荐(0) 编辑
摘要: 在数据分析过程中必然会面对较多的时间数据,迷惑好久之后总结了一个较为快速的方法: 源数据中该列数据为文本或者数字,如下图 pandas读取数据之后,直接通过datetime模块将其转换为时间格式: data['Time']=pd.to_datetime(data['Time']),得到的结果类似如下 阅读全文
posted @ 2020-01-18 10:43 飞哥霸气 阅读(631) 评论(0) 推荐(0) 编辑
摘要: 数据分析过程中,经常会使用Python之对DataFrame的多列数据运用apply函数操作,通过上述操作可以快速综合多列数据得到相应结果。 如果得到的结果只有一个数,则可以直接赋值到DataFrame中的新字段,但是我在分析过程中往往会遇到,函数结果为元组(例如得到两个字段),此时需要将结果分别赋 阅读全文
posted @ 2020-01-06 14:28 飞哥霸气 阅读(8721) 评论(0) 推荐(1) 编辑
摘要: 以两列数据为例: def sum_test (a, b): return a+b 如果想对df表中其中两列(列名1,列名2)作加和处理操作,得到新列名位sum_value: 两种不同的写法: 1、df ['sum_value'] = df.apply(lambda x: sum_test(x['列名 阅读全文
posted @ 2020-01-06 11:20 飞哥霸气 阅读(19527) 评论(0) 推荐(0) 编辑