Python:文件读写
TXT
1、读取TXT文件
with open('File.txt' , 标识符) as f: print(f.read())
标识包括:r——文本文件;rb——二进制文件
为避免出现文件不存在时读取空文件出现的FileNotFoundError错误,建议用try...except语句块
try: with open('File.txt' , 标识符) as f: print(f.read()) except FileNotFoundError: 处理语句
读取函数有:read()、readlines()、readline()
read():一次读取整个文件,直接将所有文件的内容都放到一个字符串变量中。如果文件大于可用内存,为了保险起见,可以反复调用read(size)方法,每次读取size个字节的内容。
readlines():以行的方式读取整个文件,每行会作为一个List的元素,可通过迭代访问每行的内容
readline():每次只读一行,需要用迭代方式读完整个文件,通常比前两个方式慢得多。很少用
注意:
①这三种方式都会把每行末尾的'\n'给读取进来,需要我们手动去掉。
with open('File.txt' , 'r') as f1: list=f1.readlines() for i in range(0,len(list)): list[i]=list[i].rstrip('\n')
str.rstrip(ch):去除字符串末尾的字符ch,缺省时为去除空格
②读取文件不存在时,会产生IOError
③读取包含中文文本的文件时,需要填写encoding='utf-8',否则会产生UnicodeDecodeError
2、写文件
写文件与读文件类似,唯一的区别在于调用open()函数时,传入标识符为'w'或者'wb'表示写文本文件和二进制文件
with open ( 'File.txt' , 'w' ) as f: f.write('Hello , world!')
写入文件不存在也不会出现IOError,而是会自动生成一个新文件。
写入函数:write()、writelines()
write():与read()、readline()方法对应,直接将一段字符串写入文件中
writelines():与readlines()方法对应,针对List。它接收一个字符串List作为参数,将它们写入到文件中,换行符不会自动加入,需要显式加入换行符
with open('File.txt' , 'w') as f: f.writelines([ '1' , '2' , '3' ]) #此时File.txt的内容为:123 with open('File.txt' , 'w') as f: f.writelines( ['1\n' , '2\n' , '3\n']) #此时File.txt的内容为: #1 #2 #3
3、标识符
'r':读
'w':写
'a':追加(区别于w的覆盖),文件不存在时创建
'r+':可读可写,文件不存在时报错IOError
'w+':可读可写,文件不存在时创建
'a+':可读可追加,文件不存在时创建
以上只针对文本文件,如果是二进制文件,只需都加一个b即可:
'rb'、'wb'、'ab'、'rb+'、'wb+'、'ab+'
4、文件指针偏移
f.seek(offset , whence=0)
该方法用于在文件中移动文件指针。offset表示偏移量。可选参数whence表示从哪里开始偏移,默认是0为文件开头,1为当前位置,2为文件尾部。举例:
with open ( 'File.txt' , 'a+' ) as f : print(f.read()) f.write('1') f.seek(0,0)#把文件指针从末尾移动到开头,没有这句话下面的read()就读不到正确的东西 print(f.reaad())
写文件后,如果还要用到读文件,就要用到该方法。
注意:该偏移方法只是作用于'r',对'w'和'a'不起作用——'w'永远是从开头(覆盖)写;'a'永远是从最后追加。
5、编码
要读取非UTF-8编码的文本文件,需要给open()函数传入encoding参数,例如:读取GBK编码的文件
with open('File.txt','r',encoding='gbk') as f : print(f.read())
而遇到有些编码不规范的文件,可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。这种情况下,open()函数还接收一个errors参数,表示遇到错误后的处理方法。最简单的方式是直接忽略:
with open('File.txt' , 'r' , encoding='gbk' , errors='ignore')
!!!!!!!!
注意:读写二进制文件时,不需要加encoding参数;读写包含中文文本文件时,需要加encoding='utf-8'
如果读写包含中文文本的txt文件出现无法读取中文的情况,尝试不设置encoding参数
Excel
三种方式:
1、xlrd和xlwt;
2、openpyxl;
3、pandas
建立一个Data.xlsx文件,第一个工作表sheet1区域"A1 : E5"的内容如下,用于测试读Excel的代码:
xlrd与xlwt && openpyxl
以前总结过:Python:Excel
pandas:Pandas:read_excel、to_csv - ShineLe - 博客园
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· 百万级群聊的设计实践
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战
· 永远不要相信用户的输入:从 SQL 注入攻防看输入验证的重要性