python 文件操作

文件处理

什么是文件

文件是操作系统提供给用户或应用程序操作硬盘的一种虚拟的概念。

用户和应用程序可以通过文件将数据永久保存在硬盘中。操作文件就是操作硬盘。

打开文件 open()

model参数:控制文件读写内容,t 和 b,必须配合r a w使用。

t 文本模式(默认模式)

	1.读写都以str为单位

	2.必须是文本文件

	3.必须指定encoding(不指定的会使用系统默认的编码)

b 二进制模式(bytes)

open的模式1:控制文件读写的模式

文件操作的基本流程

1.打开文件:open(‘文件路径’)

绝对路径:完整的路径,从磁盘开始,一层层的写

相对路径:相对于当前程序所在的文件夹为起始开始找

with as 上下文管理
with open(r'C:\Users\Administrator\AppData\Local\Temp\3.py\111',mode='rt',encoding='utf_8') as f :
    res=f.read()
    print(res)

2、操作文件:读/写文件,应用程序对文件的读写请求都是在向操作系统发送系统调用,然后由操作系统控制硬盘把输入读入内存、或者写入硬盘。

3.关闭文件:.close( )

.close() # 回收操作系统资源
.read() # 变量f存在,但是不能再读了

del f # 回收应用程序资源

参数mode详解

t模式:文本模式

r(默认操作模式):只读模式,全部读取,有多少读多少。当文件存在时文件指针跳到开始位置。

with open('c.txt',mode='rt',encoding='utf-8') as f:
    print('第一次读'.center(50,'*'))
    res=f.read() # 把所有内容从硬盘读入内存
    print(res)
===============案例==================
inp_username=input('your name>>: ').strip()
inp_password=input('your password>>: ').strip()

# 验证
with open('user.txt',mode='rt',encoding='utf-8') as f:
    for line in f:
        # print(line,end='') # egon:123\n
        username,password=line.strip().split(':')
        if inp_username == username and inp_password == password:
            print('login successfull')
            break
    else:
        print('账号或密码错误')

2、w:只写模式,当文件不存在时会创建空文件,当文件存在会清空文件,指针位于开始位置,不能读。

强调1:
在以w模式打开文件没有关闭的情况下,连续写入,新的内容总是跟在旧的之后

with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒1\n')
    f.write('擦勒2\n')
    f.write('擦勒3\n')

强调2:
如果重新以w模式打开文件,则会清空文件内容

with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒1\n')
with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒2\n')
with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒3\n')

3、a:只追加写,在文件不存在时会创建空文档,在文件存在时文件指针会直接调到末尾

with open('e.txt',mode='at',encoding='utf-8') as f:
    # f.read() # 报错,不能读
    f.write('擦嘞1\n')
    f.write('擦嘞2\n')
    f.write('擦嘞3\n')

强调 w 模式与 a 模式的异同:
1 相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后
2 不同点:以 a 模式重新打开文件,不会清空原文件内容,会将文件指针直接移动到文件末尾,新写的内容永远写在最后
案例:a模式用来在原有的文件内存的基础之上写入新的内容,比如记录日志、注册
注册功能

name=input('your name>>: ')
pwd=input('your name>>: ')
with open('db.txt',mode='at',encoding='utf-8') as f:
    f.write('{}:{}\n'.format(name,pwd))

了解:+不能单独使用,必须配合r、w、a

b模式:bytes格式

  • 硬盘的二进制不做任何转换直接读入内存,python不显示二进制(太长了)
  • python会把内存的二进制处理成bytes(16进制)类型显示输出,英文显示原字母。
  • 必须不能指定encoding

mode=‘rb’:只读

with open (r'C:\Users\Administrator\Desktop\111.txt',mode='rb') as f:
    res=f.read()
    print(res,type(res))
    print(res.decode('utf-8'))#指定解码类型将二进制数解码成uft8输出
    结果:
    b'\xe9\x98\xbf\xe5\x87\xa1\xe8\xbe\xbeaaaa' <class 'bytes'>
	阿凡达aaaa

mode=‘wb’:只写

 with open('a.txt',mode='wb') as f:
     msg="你好"
     res=msg.encode('utf-8') # res为bytes类型
     f.write(res) # 在b模式下写入文件的只能是bytes类型

循环实现文件copy

方式一:while循环读文件(可以指定一次读取的字节)

with open('a.txt',mode='wb') as f1:
    with open('a.txt',mode='wb') as f2:
    while=1:
        res=f.read(1024)#不规定字节的话一次全部读取文件的全部内容,可能导致占用太多内存计算机卡死。
        f2=write(res)
        if len (res)==0:
            break

方式二:for循环读文件如果一行有太多字节也能导致占用太多内存计算机卡死。

with open('a.txt',mode='wb') as f:
    for line in f:#for循环默认换行符为分割符
        res=line.read()
        f2=write(res)

文件操作方法

读相关操作:

f.read() # 读取所有内容,执行完该操作后,文件指针会移动到文件末尾

f.readline() # 读取一行内容,光标移动到第二行首部
f.readlines() # 读取每一行内容,存放于列表中

写相关操作:

f.flush:立即写入硬盘
f.write('1111\n222\n')  # 针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8'))  # 针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n'])  # 文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式

其他操作:

f.readable()  # 文件是否可读
f.writable()  # 文件是否可读
f.closed  # 文件是否关闭
f.encoding  # 如果文件打开模式为b,则没有该属性
f.flush()  # 立刻将文件内容从内存刷到硬盘
f.name #获取文件名
file.next() #返回文件下一行。Python 3 中的 File 对象不支持 next() 方法。
file.truncate([size]) #从文件的首行首字符开始截断,截断文件为 size 个字符

控制指针移动

大前提:文件内指针的移动都是Bytes为单位的,唯一例外的是t模式下read(n),n以字符为单位

# 之前文件内指针的移动都是由读/写操作而被动触发的,若想读取文件某一特定位置的数据,则则需要用f.seek方法主动控制文件内指针的移动,详细用法如下:
# f.seek(指针移动的字节数,模式控制): 如果移到末尾了就不能再往后移动了,指针只会停在末尾。
# 模式控制:
# 0: 默认的模式,该模式代表指针移动的字节数是以文件开头为参照的
# 1: 该模式代表指针移动的字节数是以当前所在的位置为参照的
# 2: 该模式代表指针移动的字节数是以文件末尾的位置为参照的

*强调:其中0模式可以在t或者b模式使用,而1跟2模式只能在b模式下用*    

文件修改

修改硬件中文件的的方式只有一个就是:覆盖

  • 基于w模式修改
    实现思路:将文件内容发一次性全部读入内存,然后在内存中修改完毕后再覆盖写回原文件
    优点: 在文件修改过程中同一份数据只有一份,一般用于文本格式
    缺点: 会过多地占用内存

    with open('c.txt',mode='rt',encoding='utf-8') as f:
        res=f.read()
        data=res.replace('alex','dsb')
        print(data)
    
    with open('c.txt',mode='wt',encoding='utf-8') as f1:
        f1.write(data)
    
  • 基于import os
    实现思路:以读的方式打开原文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完
    后写入临时文件...,删掉原文件,将临时文件重命名原文件名
    优点: 不会占用过多的内存
    缺点: 在文件修改过程中同一份数据存了两份,过多的占用硬盘

    with open('c.txt', mode='rt', encoding='utf-8') as f, \
            open('.c.txt.swap', mode='wt', encoding='utf-8') as f1:
        for line in f:
            f1.write(line.replace('alex', 'dsb'))
    
    os.remove('c.txt')
    os.rename('.c.txt.swap', 'c.txt')
    
posted @ 2020-03-13 16:17  Franciszw  阅读(310)  评论(0编辑  收藏  举报