05 2024 档案

摘要:假设现在有两个dataframe,分别是A和B,它们有相同的列text和label。现在想使用B的label来更新A的label,基于它们共同的text。 import pandas as pd # Sample DataFrames A and B data_A = {'text': ['text 阅读全文
posted @ 2024-05-26 10:51 笑而不语心自闲 阅读(88) 评论(0) 推荐(0) 编辑
摘要:如果df数据已经设置了索引,现在想增加二级索引,可以用下面的方法 df.reset_index(inplace=True) df.set_index(['index1', 'index2'], inplace=True) # 可以转换内外标签 df.swaplevel() 阅读全文
posted @ 2024-05-24 22:11 笑而不语心自闲 阅读(37) 评论(0) 推荐(0) 编辑
摘要:如题,pandas读取excel时出现"No codepage record..."错误 解决方法: # 用xlrd打开excel文件,指定encoding_override为gbk或者其它编码格式 wb = xlrd.open_workbook_xls(file_name, encoding_ov 阅读全文
posted @ 2024-05-24 22:06 笑而不语心自闲 阅读(90) 评论(0) 推荐(0) 编辑
摘要:index2 和 reasons_id 数据显示重复,可以删除列'reasons_id',如果强迫症必须删除索引,可以用下面的方法 # reasons_id total_price ... total_price_统计 people_num_统计 # index1 index2 ... # A 变座 阅读全文
posted @ 2024-05-03 18:55 笑而不语心自闲 阅读(13) 评论(0) 推荐(0) 编辑
摘要:C=pd.merge(A,B),merge之后C的行数并不会变。但是A的index丢失了,因为merge之后index是重排的。 解决办法: 方法1: #可以先把A的index保存一下,A、B中含有"col"列 A_index =A.index C=pd.merge(A,B,on="col",how 阅读全文
posted @ 2024-05-03 18:24 笑而不语心自闲 阅读(184) 评论(0) 推荐(0) 编辑