pandas相关(不定期更新)
1.pandas 读取excel时,遇到数字变为科学计数法
# 解决方法,将对应字段转为str
df = pd.read_excel("./test.xlsx", converters={"id": str})
2.pandas读取TXT
假如有一个txt文件,它里面的元素是以空格或制表符分隔的,且没有规律,在这种情况下,就可以用正则表达式兼顾两种分隔符。可以使用通配符\s,\s匹配空格和制表符,’’表示1个或者多个字符。例如:
df=pd.read_table('data1.txt', sep='\s+')
另外一种常见情况是,解析数据时把空行排除在外,文件中的表头或没有必要的注释也用不到。使用skiprows选项,可以排除多余的行,把要删除的行和行号放到数字中,赋值给该参数即可。例如:
skiprows参数是除外多少行
skiprows=5:排除前五行
skiprows=[5]:排除第五行
df=pd.read_table('data3.txt', sep=',', skiprows=[0,1,3,6])
3.pandas字符串列合并,合并函数str.cat
准备数据:
import pandas as pd
df = pd.DataFrame({'姓名' : ['小红','大红','小明','大明','小亮'],
'性别' : ['女', '女','男','男','男'],
'班级' : [1,2,1,1,2],
'身高' : [160,161,180,180,170]
}
)print(df)
函数代码:
df['合并1']=df['姓名']+df['性别'] #+df['身高']
df['合并2']=df['姓名'].str.cat(df['性别'],sep=',')#str.cat可以加sep参数分隔符
print(df)
4.pandas将列数据转成列表
函数代码:
file_name = df['姓名'].values.tolist()
本文作者:安全兔
本文链接:https://www.cnblogs.com/safe-rabbit/p/16637045.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议许可协议进行许可。
分类:
标签:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· .NET10 - 预览版1新功能体验(一)