python 文件读写、shutil模块
参考自:https://www.cnblogs.com/alex3714/articles/5717620.html
1. 文件基础操作
f = open('test.txt') #打开文件
first_line = f.readline() # 每次读一行,并移动文件指针
print('first line:',first_line) #读一行
print('分隔线'.center(50,'-'))
data = f.read() # 读取剩下的所有内容,会一次性读取到内存,可能导致内存溢出
print(data) #打印文件内容
f.close() #关闭文件
2. with open 语句
上面的文件操作需要手动关闭文件:f.close(),为了避免打开文件后忘记关闭,可以通过管理上下文,当with代码块执行完毕时,内部会自动关闭并释放文件资源,例如:
with open('test.txt','r',encoding='utf-8') as f:
print(f.readline())
在Python 2.7 后,with又支持同时对多个文件的上下文进行管理,即:
with open('log1') as obj1, open('log2') as obj2:
pass
3. 打开文件的方式
打开文件的模式有:
- r, 只读模式(默认)。
- w,只写模式。【不可读;不存在则创建;存在则覆盖文件内容】
- a,追加模式。【可读; 不存在则创建;存在则在文件末尾追加内容;】
"+" 表示可以同时读写某个文件
- r+,可读写文件。【可读;可写(作为追加模式);可追加】
- w+,写读【先写入,后读取,如果存在文件,先覆盖写入,在读取,没啥用】
- a+,追加写入读取,默认文件指针处在文件的末尾,如果要读取,需要先f.seek(0),而无论文件指针处在什么位置,只要写入,就追加写在文件末尾
"U"表示在读取时,可以将 \r \n \r\n
自动转换成 \n
(与 r 或 r+ 模式同使用)
- rU
- r+U
"b"表示处理二进制文件(如:图片、视频、音频,FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)
- rb
- wb
- ab
4. 常用方法
with open('text.txt','r+',encoding='utf-8') as f:
content = f.read() # 一次性读取文件所有内容,如果文件过大,可能内存溢出
f.readlines() # 一次性读取所有文件的行,生成一个列表,效率低
f.readline() # 读取文件的一行,效率高
f.tell() # 获取文件的指针所在字节位置
f.seek() # 移动文件的指针
f.truncate(8) # 截取文件前8个字节
for line in f: # 循环读取文件的行,效率高
print(line) f.write('new message') # 写入文件 f.flush() # 刷新缓存,直接将文件写入
2. shutil模块
import shutil
f1 = open('a.txt','r')
f2 = open('b.txt','w')
# shutil.copyfileobj(fsrc, fdst[, length]) 把fsrc复制到一个新文件fdst里,length代表每次读取的大小,防止内存溢出
shutil.copyfileobj(f1,f2,1024)
# copy(src, dst, *, follow_symlinks=True)复制一个文件的路径,到另一个路径(可以为路径或者文件名),follow_symlinks在linux生效,具体搜索硬连接和软连接
shutil.copy('a.txt','../b.txt')
# chown(path, user=None, group=None) 改变给定path的所有者和组权限,似乎在linux生效
# shutil.chown()
# copy2(src, dst, *, follow_symlinks=True) 复制数据和数据的状态信息
shutil.copy2('a.txt','../b.txt')
# copymode(src, dst, *, follow_symlinks=True) 仅拷贝权限。内容、组、用户均不变
shutil.copymode()
# copystat(src, dst, *, follow_symlinks=True) 拷贝状态的信息,包括:mode bits, atime, mtime, flags
shutil.copystat()
# copytree(src, dst, symlinks=False, ignore=None, copy_function=copy2,
# ignore_dangling_symlinks=False) 复制一个文件夹及其内容到另一个文件夹下,ignore过滤条件,可以多个
# 注意,必须要指定一个文件夹,即把a文件夹的内容,复制到父目录的b里面(b一定不能事先存在)
shutil.copytree('a','../b',ignore=shutil.ignore_patterns('*.bat','*.py'))
# 获取一个路径的磁盘占用,返回一个三元组(total,used,free)
print(shutil.disk_usage('D:\\'))
# 显示支持的打包格式/解压包的格式
print(shutil.get_archive_formats())
print(shutil.get_unpack_formats())
# 打包文件 (包名,格式,要打包的路径)
shutil.make_archive('a_zip','zip','a')
# 移动文件或文件夹到另一路径: (源文件路径,目标路径)
shutil.move('a','../')
# 注册一个新的打包方式?
shutil.register_archive_format()
shutil.register_unpack_format()
# 删除文件夹及其内容,选择是否忽略错误(默认false,没有要删除的文件夹会报错)
shutil.rmtree('a',ignore_errors=True)
# (文件名,[,解压路径,解压方式]) unpack_archive(filename, extract_dir=None, format=None)
shutil.unpack_archive('a.zip','a')
# shutil.unregister_archive_format()
# shutil.unregister_unpack_format()
3. 断点复制
import os
def copy_file(remote_file, local_file, block=10240):
"""
断点复制文件
:param remote_file: 想要复制的文件
:param local_file: 复制到本地的文件
:param block: 每次复制的大小(字节)
:return:
"""
try:
if os.path.exists(local_file):
copyed_size = os.path.getsize(local_file)
else:
copyed_size = 0
total_size = os.path.getsize(remote_file)
if copyed_size != total_size:
remote_f = open(remote_file, 'rb')
local_f = open(local_file, 'ab')
remote_f.seek(copyed_size, 0) # 移动源文件指针,从没复制过的那部分开始
while True:
con = remote_f.read(block) # 每次读取 block 大小
if not con: break # 为空说明读完了
local_f.write(con) # 本地写入
local_f.close()
remote_f.close()
except Exception as e:
print(e)
return False
return True
copy_file(r'C:\pasd.txt', r'password.txt')