摘要: 在操作pandas的DataFrame的时候,常常会遇到某些列是字符串,某一些列是数值的情况,如果直接使用df_obj.apply(sum)往往会出错使用如下方式即可对其中某一列进行求和 dataf_test1['diff'].sum() // diff为要求和的列 阅读全文
posted @ 2023-07-18 17:17 Oops!# 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 原本的数据类型凌乱不按照日期排序,不利于数据分析 import pandas as pd#读取文件数据df = pd.read_csv('clientinfo-截止2019-12-20:00:00.csv')#按照列值排序data=df.sort_values(by="createtime" , a 阅读全文
posted @ 2023-07-18 17:15 Oops!# 阅读(88) 评论(0) 推荐(0) 编辑
摘要: 如何用python中pandas模块在csv文件中添加表头 话不多说,直接上代码: python 复制代码 import pandas as pd df = pd.read_csv('tf.csv',header=None,names=['a','b','c','d','e','f','g','h' 阅读全文
posted @ 2023-07-18 17:06 Oops!# 阅读(1088) 评论(0) 推荐(0) 编辑
摘要: DataFrame.iat 按整数位置访问行/列对的单个值。 与iloc类似,两者都提供基于整数的查找。如果只需要在DataFrame或Series中获取或设置一个值,则使用iat。 Raises: 当整数位置超出界限时抛出IndexError 例子: >>> df = pd.DataFrame([ 阅读全文
posted @ 2023-07-18 15:27 Oops!# 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 保留原顺序。 old_list = [2, 3, 4, 5, 1, 2, 3] new_list = [] for i in old_list: if i not in new_list: new_list.append(i) print(new_list) # [2, 3, 4, 5, 1] 用字 阅读全文
posted @ 2023-07-18 14:08 Oops!# 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 1.删除重复的数据 df.drop_duplicates();默认删除完全一样的行数据。 2.删除NaN数据 df.dropna() ;默认删除掉行数据,只要一行中有NaN; 3.pandas读取excel空白单元格默认设置修改 pandas读取excel表格空值为NaN;用df.fillna没有效 阅读全文
posted @ 2023-07-18 13:59 Oops!# 阅读(764) 评论(0) 推荐(0) 编辑