文件处理

1.文件与文件模式介绍
  • 什么是文件

    文件是操作系统提供给用户/应用程序操作硬盘的一种虚拟的概念/接口

    用户/应用程序(open())
    操作系统(文件)
    计算机硬件(硬盘)

  • 2、为何要用文件

    用户/应用程序可以通过文件将数据永久保存的硬盘中
    即操作文件就是操作硬盘

    用户/应用程序直接操作的是文件,对文件进行的所有的操作,都是在向操作系统发送系统调用,然后再由操作将其转换成具体的硬盘操作

  • 3、如何用文件:open()

    控制文件读写内容的模式:t和b
    强调:t和b不能单独使用,必须跟r/w/a连用

    t文本(默认的模式)
    1、读写都以str(unicode)为单位的
    2、文本文件
    3、必须指定encoding='utf-8'

    b二进制/bytes

    控制文件读写操作的模式
    r只读模式
    w只写模式
    a只追加写模式
    +:r+、w+、a+

2.文件操作基本
  • 打开文件

    # windows路径分隔符问题
    open('C:\a.txt\nb\c\d.txt')
    # 解决方案一:推荐
    open(r'C:\a.txt\nb\c\d.txt')
    # 解决方案二:
    open('C:/a.txt/nb/c/d.txt')
    
    f = open(r'aaa/a.txt',mode='rt') # f的值是一种变量,占用的是应用程序的内存空间
    print(f) # <_io.TextIOWrapper name='aaa/a.txt' mode='rt' encoding='cp936'>
    # x=int(10)
    

  • 操作文件:读/写文件,应用程序对文件的读写请求都是在向操作系统发送系统调用,然后由操作系统控制硬盘把输入读入内存、或者写入硬盘

    f = open(r'aaa/a.txt',mode='rt') # f的值是一种变量,占用的是应用程序的内存空间
    res=f.read()
    print(type(res))
    # print(res) # a.txt的内容
    
    # 3、关闭文件
    f.close() # 回收操作系统资源
    # print(f)
    # f.read() # 变量f存在,但是不能再读了
    
    # del f     # 回收应用程序资源
    

3.with上下文管理

  • 文件对象又称为文件句柄,就是想游戏手柄一样来操作文件

    with open('a.txt',mode='rt') as f1: # f1=open('a.txt',mode='rt')
        res=f1.read()
        print(res) # a.txt的内容
    
    with open('a.txt',mode='rt') as f1,\
            open('b.txt',mode='rt') as f2:
        res1=f1.read()
        res2=f2.read()
        print(res1) # a.txt的内容
        print(res2) # b.txt的内容
    
        # f1.close()
        # f2.close()
    
4.指定字符编码
  • 强调:t和b不能单独使用,必须跟r/w/a连用

    '''
    t文本(默认的模式)
    1、读写都以str(unicode)为单位的
    2、文本文件
    3、必须指定encoding='utf-8'
    
    '''
    # 没有指定encoding参数操作系统会使用自己默认的编码
    # linux系统默认utf-8
    # windows系统默认gbk
    
    with open('c.txt',mode='rt',encoding='utf-8') as f:
        res=f.read() # t模式会将f.read()读出的结果解码成unicode
        print(res,type(res)) # c.txt的内容 <class 'str'>
    
5.文件操作模式详解:以t模式为基础进行内存操作
  1. r(默认的操作模式):只读模式,当文件不存在时报错,当文件存在时文件指针跳到开始位置

    with open('c.txt',mode='rt',encoding='utf-8') as f:
        print('第一次读'.center(50,'*'))
        res=f.read() # 把所有内容从硬盘读入内存
        print(res) 
    
    with open('c.txt', mode='rt', encoding='utf-8') as f:
        print('第二次读'.center(50,'*'))
        res1=f.read()
        print(res1)
    # 结果
    ***********************第一次读***********************
    哈哈哈哈
    ***********************第二次读***********************
    哈哈哈哈
    
    with open('c.txt',mode='rt',encoding='utf-8') as f:
        print('第一次读'.center(50,'*'))
        res=f.read() # 把所有内容从硬盘读入内存
        print(res) 
        print('第二次读'.center(50,'*'))
        res1=f.read()
        print(res1)
    # 结果
    ***********************第一次读***********************
    哈哈哈哈
    ***********************第二次读***********************
    
                   ===============案例==================
            
    inp_username=input('your name>>: ').strip()
    inp_password=input('your password>>: ').strip()
    
    # 验证
    with open('user.txt',mode='rt',encoding='utf-8') as f:
        for line in f:
            # print(line,end='') # egon:123\n
            username,password=line.strip().split(':')
            if inp_username == username and inp_password == password:
                print('login successfull')
                break
        else:
            print('账号或密码错误')
    应用程序====》文件
    应用程序====》数据库管理软件=====》文件
    
  2. w:只写模式,当文件不存在时会创建空文件,当文件存在会清空文件,指针位于开始位置

    with open('d.txt',mode='wt',encoding='utf-8') as f:
        f.read() # 报错,不可读
        f.write('擦勒\n')
    # 强调1:
    # 在以w模式打开文件没有关闭的情况下,连续写入,新的内容总是跟在旧的之后
    with open('d.txt',mode='wt',encoding='utf-8') as f:
        f.write('擦勒1\n')
        f.write('擦勒2\n')
        f.write('擦勒3\n')
        
    # 强调2:
    # 如果重新以w模式打开文件,则会清空文件内容
    with open('d.txt',mode='wt',encoding='utf-8') as f:
        f.write('擦勒1\n')
    with open('d.txt',mode='wt',encoding='utf-8') as f:
        f.write('擦勒2\n')
    with open('d.txt',mode='wt',encoding='utf-8') as f:
        f.write('擦勒3\n')
        
    # 案例:w模式用来创建全新的文件
    
    # 文件文件的copy工具
    src_file=input('源文件路径>>: ').strip()
    dst_file=input('源文件路径>>: ').strip()
    with open(r'{}'.format(src_file),mode='rt',encoding='utf-8') as f1,\
        open(r'{}'.format(dst_file),mode='wt',encoding='utf-8') as f2:
        res=f1.read()
        f2.write(res)
    
  3. a:只追加写,在文件不存在时会创建空文档,在文件存在时文件指针会直接调到末尾

    with open('e.txt',mode='at',encoding='utf-8') as f:
        # f.read() # 报错,不能读
        f.write('擦嘞1\n')
        f.write('擦嘞2\n')
        f.write('擦嘞3\n')
    # 强调 w 模式与 a 模式的异同:
    # 1 相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后
    # 2 不同点:以 a 模式重新打开文件,不会清空原文件内容,会将文件指针直接移动到文件末尾,新写的内容永远写在最后
    
    # 案例:a模式用来在原有的文件内存的基础之上写入新的内容,比如记录日志、注册
    
    #注册功能
    name=input('your name>>: ')
    pwd=input('your name>>: ')
    with open('db.txt',mode='at',encoding='utf-8') as f:
        f.write('{}:{}\n'.format(name,pwd))
    
    # 了解:+不能单独使用,必须配合r、w、a
    with open('g.txt',mode='rt+',encoding='utf-8') as f:
        # print(f.read())
        f.write('中国') # g.txt文件“中国”会从头覆盖写的前四个字节的内容
    with open('g.txt',mode='w+t',encoding='utf-8') as f:
        f.write('111\n')
        f.write('222\n')
        f.write('333\n')
        print('====>',f.read()) # g.txt文件清空内容后添加所写的内容
    
    with open('g.txt',mode='a+t',encoding='utf-8') as f:
        print(f.read()) # 报错 a类型不能读
        f.write('444\n')
        f.write('5555\n')
        print(f.read()) # g.txt文件最后、后添加所写的内容