python 文件操作
文件处理
什么是文件
文件是操作系统提供给用户或应用程序操作硬盘的一种虚拟的概念。
用户和应用程序可以通过文件将数据永久保存在硬盘中。操作文件就是操作硬盘。
打开文件 open()
model参数:控制文件读写内容,t 和 b,必须配合r a w使用。
t 文本模式(默认模式)
1.读写都以str为单位
2.必须是文本文件
3.必须指定encoding(不指定的会使用系统默认的编码)
b 二进制模式(bytes)
open的模式1:控制文件读写的模式
文件操作的基本流程
1.打开文件:open(‘文件路径’)
绝对路径:完整的路径,从磁盘开始,一层层的写
相对路径:相对于当前程序所在的文件夹为起始开始找
with as 上下文管理
with open(r'C:\Users\Administrator\AppData\Local\Temp\3.py\111',mode='rt',encoding='utf_8') as f :
res=f.read()
print(res)
2、操作文件:读/写文件,应用程序对文件的读写请求都是在向操作系统发送系统调用,然后由操作系统控制硬盘把输入读入内存、或者写入硬盘。
3.关闭文件:.close( )
.close() # 回收操作系统资源
.read() # 变量f存在,但是不能再读了
del f # 回收应用程序资源
参数mode详解
t模式:文本模式
r(默认操作模式):只读模式,全部读取,有多少读多少。当文件存在时文件指针跳到开始位置。
with open('c.txt',mode='rt',encoding='utf-8') as f:
print('第一次读'.center(50,'*'))
res=f.read() # 把所有内容从硬盘读入内存
print(res)
===============案例==================
inp_username=input('your name>>: ').strip()
inp_password=input('your password>>: ').strip()
# 验证
with open('user.txt',mode='rt',encoding='utf-8') as f:
for line in f:
# print(line,end='') # egon:123\n
username,password=line.strip().split(':')
if inp_username == username and inp_password == password:
print('login successfull')
break
else:
print('账号或密码错误')
2、w:只写模式,当文件不存在时会创建空文件,当文件存在会清空文件,指针位于开始位置,不能读。
强调1:
在以w模式打开文件没有关闭的情况下,连续写入,新的内容总是跟在旧的之后
with open('d.txt',mode='wt',encoding='utf-8') as f:
f.write('擦勒1\n')
f.write('擦勒2\n')
f.write('擦勒3\n')
强调2:
如果重新以w模式打开文件,则会清空文件内容
with open('d.txt',mode='wt',encoding='utf-8') as f:
f.write('擦勒1\n')
with open('d.txt',mode='wt',encoding='utf-8') as f:
f.write('擦勒2\n')
with open('d.txt',mode='wt',encoding='utf-8') as f:
f.write('擦勒3\n')
3、a:只追加写,在文件不存在时会创建空文档,在文件存在时文件指针会直接调到末尾
with open('e.txt',mode='at',encoding='utf-8') as f:
# f.read() # 报错,不能读
f.write('擦嘞1\n')
f.write('擦嘞2\n')
f.write('擦嘞3\n')
强调 w 模式与 a 模式的异同:
1 相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后
2 不同点:以 a 模式重新打开文件,不会清空原文件内容,会将文件指针直接移动到文件末尾,新写的内容永远写在最后
案例:a模式用来在原有的文件内存的基础之上写入新的内容,比如记录日志、注册
注册功能
name=input('your name>>: ')
pwd=input('your name>>: ')
with open('db.txt',mode='at',encoding='utf-8') as f:
f.write('{}:{}\n'.format(name,pwd))
了解:+不能单独使用,必须配合r、w、a
b模式:bytes格式
- 硬盘的二进制不做任何转换直接读入内存,python不显示二进制(太长了)
- python会把内存的二进制处理成bytes(16进制)类型显示输出,英文显示原字母。
- 必须不能指定encoding
mode=‘rb’:只读
with open (r'C:\Users\Administrator\Desktop\111.txt',mode='rb') as f:
res=f.read()
print(res,type(res))
print(res.decode('utf-8'))#指定解码类型将二进制数解码成uft8输出
结果:
b'\xe9\x98\xbf\xe5\x87\xa1\xe8\xbe\xbeaaaa' <class 'bytes'>
阿凡达aaaa
mode=‘wb’:只写
with open('a.txt',mode='wb') as f:
msg="你好"
res=msg.encode('utf-8') # res为bytes类型
f.write(res) # 在b模式下写入文件的只能是bytes类型
循环实现文件copy
方式一:while循环读文件(可以指定一次读取的字节)
with open('a.txt',mode='wb') as f1:
with open('a.txt',mode='wb') as f2:
while=1:
res=f.read(1024)#不规定字节的话一次全部读取文件的全部内容,可能导致占用太多内存计算机卡死。
f2=write(res)
if len (res)==0:
break
方式二:for循环读文件如果一行有太多字节也能导致占用太多内存计算机卡死。
with open('a.txt',mode='wb') as f:
for line in f:#for循环默认换行符为分割符
res=line.read()
f2=write(res)
文件操作方法
读相关操作:
f.read() # 读取所有内容,执行完该操作后,文件指针会移动到文件末尾
f.readline() # 读取一行内容,光标移动到第二行首部
f.readlines() # 读取每一行内容,存放于列表中
写相关操作:
f.flush:立即写入硬盘
f.write('1111\n222\n') # 针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8')) # 针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n']) # 文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式
其他操作:
f.readable() # 文件是否可读
f.writable() # 文件是否可读
f.closed # 文件是否关闭
f.encoding # 如果文件打开模式为b,则没有该属性
f.flush() # 立刻将文件内容从内存刷到硬盘
f.name #获取文件名
file.next() #返回文件下一行。Python 3 中的 File 对象不支持 next() 方法。
file.truncate([size]) #从文件的首行首字符开始截断,截断文件为 size 个字符
控制指针移动
大前提:文件内指针的移动都是Bytes为单位的,唯一例外的是t模式下read(n),n以字符为单位
# 之前文件内指针的移动都是由读/写操作而被动触发的,若想读取文件某一特定位置的数据,则则需要用f.seek方法主动控制文件内指针的移动,详细用法如下:
# f.seek(指针移动的字节数,模式控制): 如果移到末尾了就不能再往后移动了,指针只会停在末尾。
# 模式控制:
# 0: 默认的模式,该模式代表指针移动的字节数是以文件开头为参照的
# 1: 该模式代表指针移动的字节数是以当前所在的位置为参照的
# 2: 该模式代表指针移动的字节数是以文件末尾的位置为参照的
*强调:其中0模式可以在t或者b模式使用,而1跟2模式只能在b模式下用*
文件修改
修改硬件中文件的的方式只有一个就是:覆盖
-
基于w模式修改
实现思路:将文件内容发一次性全部读入内存,然后在内存中修改完毕后再覆盖写回原文件
优点: 在文件修改过程中同一份数据只有一份,一般用于文本格式
缺点: 会过多地占用内存with open('c.txt',mode='rt',encoding='utf-8') as f: res=f.read() data=res.replace('alex','dsb') print(data) with open('c.txt',mode='wt',encoding='utf-8') as f1: f1.write(data)
-
基于import os
实现思路:以读的方式打开原文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完
后写入临时文件...,删掉原文件,将临时文件重命名原文件名
优点: 不会占用过多的内存
缺点: 在文件修改过程中同一份数据存了两份,过多的占用硬盘with open('c.txt', mode='rt', encoding='utf-8') as f, \ open('.c.txt.swap', mode='wt', encoding='utf-8') as f1: for line in f: f1.write(line.replace('alex', 'dsb')) os.remove('c.txt') os.rename('.c.txt.swap', 'c.txt')