文件处理
文件处理
1. 什么是文件?
#文件是操作系统为应用程序或者用户提供一种操作硬盘的虚拟单位 #强调:文件是操作系统提供的虚拟单位,应用程序或者用户对文件的读写操作其实都是向操作系统发送指令
2.为何要用文件?
#文件对应的硬盘空间,如果需要考虑永久保存数据那必须使用文件
3.如何用文件?
3.1 绝对路径:在任何文件中都可以访问到的路径,格式如下:
# win: C:\a\b\c\d.txt # linux: /a/b/c/d.txt
3.2 相对路径:相对于当前执行文件所在文件夹,格式如下:
#a/b/c/d.txt
4.文件操作
4.1 打开文件 (下面代码结果为一个io对象,即文件对象)
f=open(r'D:\学习\old_boy_study\week3\day09\a.txt',mode='r',encoding='utf-8') print(f)
4.2 读/写文件
读:
f=open(r'D:\学习\old_boy_study\week3\day09\a.txt',mode='r',encoding='utf-8') data=f.read() print(data) f.close()
写:
f=open(r'D:\学习\old_boy_study\week3\day09\a.txt',mode='wt',encoding='utf-8') f.write("哈哈哈") f.close()
4.3打开文件的另外一种写法
with open(r'D:\学习\old_boy_study\week3\day09\a.txt',mode='rt',encoding='utf-8')as f: data=f.read() print(data)
5.文件的打开模式
一. 基本介绍
1.控制文件读写操作的模式
r(默认):
w
a
2.控制文件读写内容的模式(不能单独使用,必须与r、w、a连用)
t(默认)
b
二. 详细介绍
控制文件读写操作的模式
r(默认):只读模式,以该模式打开文件,当文件不存在时则报错,当文件存在时文件指针在文件开头
判断文件的可读性:
with open('a.txt',mode='rt',encoding='utf-8') as f: print(f.readable()) print(f.writable())
使用.readline(),来读出文件中的每一行
with open('a.txt',mode='r',encoding='utf-8')as f: line=f.readline() print(line,end='') line=f.readline() print(print(line,end=''))
使用for的方法读出文件中的每一行
with open('a.txt',mode='r',encoding='utf-8')as f: for line in f: print(line,end='')
使用.readlines(),读取文本全部,按行存入列表
with open('a.txt',mode='r',encoding='utf-8')as f: data_list=f.readlines() print(data_list)
w: 只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头
判断文件的可读性:
with open('a.txt',mode='wt',encoding='utf-8') as f: print(f.readable()) print(f.writable())
在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后
f.write():
with open('a.txt',mode='wt',encoding='utf-8') as f: f.write('你瞅啥\n') f.write('瞅你那熊样\n') f.write('巴拉巴拉。。。\n')
利用for 循环写:
with open('a.txt',mode='wt',encoding='utf-8') as f: lines=['1111\n','2222\n','3333\n'] for line in lines: f.write(line)
f.writelines()
with open('a.txt',mode='wt',encoding='utf-8') as f: lines=['1111\n','2222\n','3333\n'] f.writelines(lines)
a: 只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳到文件末尾
with open('c.txt',mode='at',encoding='utf-8') as f: f.write('你好阿斯蒂芬\n') f.write('adfasdf\n') f.writelines([1,2,3])
控制文件读写内容的模式(不能单独使用,必须与r、w、a连用)
t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数
b:无论读写都是以bytes为单位的,可以操作所有文件,一定不能指定encoding参数
练习:拷贝文件小程序
with open('01.mp4',mode='rb')as read_f,\ open(r'D:\学习\old_boy_study\week3\01.mp4',mode='wb')as write_f: data=read_f.read() write_f.write(data)
了解:
+:不能单独使用,必须与rwa连用,r+ w+ a+
修改文件的两种方式
方式一:
1. 以读的方式打开源文件
2. 将文件内容一次性全读入内存,在内存完成修改
3. 以写的方式打开源文件,然后将修改后的结果一次性写入源文件
总结:
优点:在文件修改过程中硬盘只存在一份数据
缺点:浪费内存
with open('a.txt',mode='rt',encoding='utf-8')as read_f: data=read_f.read() with open('a.txt',mode='wt',encoding='utf-8')as write_f: write_f.write(data.replace("哈哈哈","哇哇哇"))
# 方式二
# 1. 以读的方式打开源文件,以写的方式打开一个临时文件
# 2. 读取源文件的一行内容到内存中,将修改的结果写入临时文件,循环往复直到改
# 3. 删除源文件,将临时文件重命名为源文件名
# 优点:同一时间在内存中只有文件的一行内容,更节省内容
# 缺点:在文件修改过程中硬盘只存在两份数据
import os with open('a.txt',mode='rt',encoding='utf-8')as read_f,\ open('.a.txt.swap',mode='wt',encoding='utf-8')as write_f: for line in read_f: write_f.write(line.replace("哇哇哇","哈哈哈")) os.remove('a.txt') os.replace('.a.txt.swap','a.txt')
杜绝秃头!!!