2023 年 7月 18 日随笔档案 - Oops!#

2023年7月18日

摘要：在操作pandas的DataFrame的时候，常常会遇到某些列是字符串，某一些列是数值的情况，如果直接使用df_obj.apply(sum)往往会出错使用如下方式即可对其中某一列进行求和 dataf_test1['diff'].sum() // diff为要求和的列阅读全文

posted @ 2023-07-18 17:17 Oops!# 阅读(198) 评论(0) 推荐(0) 编辑

pandas把csv文件数据按列排序

摘要：原本的数据类型凌乱不按照日期排序，不利于数据分析 import pandas as pd#读取文件数据df = pd.read_csv('clientinfo-截止2019-12-20：00：00.csv')#按照列值排序data=df.sort_values(by="createtime" , a 阅读全文

posted @ 2023-07-18 17:15 Oops!# 阅读(88) 评论(0) 推荐(0) 编辑

如何用python中pandas模块在csv文件中添加表头

摘要：如何用python中pandas模块在csv文件中添加表头话不多说，直接上代码： python 复制代码 import pandas as pd df = pd.read_csv('tf.csv',header=None,names=['a','b','c','d','e','f','g','h' 阅读全文

posted @ 2023-07-18 17:06 Oops!# 阅读(1088) 评论(0) 推荐(0) 编辑

Python pandas.DataFrame.iat函数方法的使用

摘要： DataFrame.iat 按整数位置访问行/列对的单个值。与iloc类似，两者都提供基于整数的查找。如果只需要在DataFrame或Series中获取或设置一个值，则使用iat。 Raises: 当整数位置超出界限时抛出IndexError 例子： >>> df = pd.DataFrame([ 阅读全文

posted @ 2023-07-18 15:27 Oops!# 阅读(62) 评论(0) 推荐(0) 编辑

Python中对列表list去重

摘要：保留原顺序。 old_list = [2, 3, 4, 5, 1, 2, 3] new_list = [] for i in old_list: if i not in new_list: new_list.append(i) print(new_list) # [2, 3, 4, 5, 1] 用字阅读全文

posted @ 2023-07-18 14:08 Oops!# 阅读(17) 评论(0) 推荐(0) 编辑

pandas处理重复、NaN数据及读取excel空值

摘要： 1.删除重复的数据 df.drop_duplicates();默认删除完全一样的行数据。 2.删除NaN数据 df.dropna() ；默认删除掉行数据，只要一行中有NaN； 3.pandas读取excel空白单元格默认设置修改 pandas读取excel表格空值为NaN；用df.fillna没有效阅读全文

posted @ 2023-07-18 13:59 Oops!# 阅读(764) 评论(0) 推荐(0) 编辑

向来枉费推移力，此日中流自在行

凡所有相，皆属虚妄，一切有为法，皆如梦幻泡影，如露亦如电，应作如是观

公告