九、文件的处理

一、文件操作的方法

1 什么是文件
    文件是操作系统提供给用户/应用程序的一种虚拟单位，该虚拟单位直接映射的是硬盘空间

2 为何要处理文件
    用户/应用程序直接操作文件（读/写）就被操作系统转换成具体的硬盘操作，从而实现
    用户/应用程序将内存中的数据永久保存到硬盘中

3 如何用文件



 文件处理的三个步骤
 f=open(r'c.txt',mode='r',encoding='utf-8') # 文件对象（应用程序的内存资源）------》操作系统打开的文件（操作系统的内存资源）
 print(f)
 data=f.read()
 f.close() # 向操作系统发送信号，让操作系统关闭打开的文件，从而回收操作系统的资源

 上下文管理
 with open(r'c.txt',mode='r',encoding='utf-8') as f,open(r'b.txt',mode='r',encoding='utf-8') as f1:
     读写文件的操作
     pass

 文件的打开模式：r（默认的） w a
 操作文件内容的模式：
 t（默认的）:操作文件内容都是以字符串为单位,会自动帮我们解码，必须指定encoding参数
 b: 操作文件内容都是以Bytes(二进制)为单位，硬盘中存的时什么就取出什么，一定不能指定encoding参数
 总结:t模式只能用于文件本文件，而b模式可以用于任意文件


 r模式：只读模式,在文件不存在时则报错，如果文件存在文件指针跳到文件的开

with open(r'c.txt',mode='rt',encoding='utf-8') as f:
    print(f.read())
    print(f.readable())
    print(f.writable())
    f.write('hello') # 只能读

    data=f.read()
    print(data,type(data))

with open(r'c.txt',mode='rb') as f:
    data=f.read()
    # print(data,type(data))
    res=data.decode('utf-8')
    print(res)


with open(r'c.txt',mode='rt',encoding='utf-8') as f:
    # line=f.readline()
    # print(line,end='')
    # line1=f.readline()
    # print(line1,end='')
    # line2 = f.readline()
    # print(line2,end='')

    lines=f.readlines()
    print(lines)
with open(r'c.txt',mode='rt',encoding='utf-8') as f:
    line=f.readline()
    print(line,end='')

# 循环读文件内容的方法：
with open(r'c.txt',mode='rt',encoding='utf-8') as f:
    for line in f:
        print(line,end='')

一、文件处理的三个步骤

1.打开文件拿到文件对象（文件对象》操作系统打开文件》硬盘）

f=open（r'文件的路径',mode='文件的打开模式',encoding='字符编码'）

2.操作文件：读/写

f.read()

f.readlines()

f.readline()

f.readable()

3.向操作系统发送指令关闭文件，回收操作系统资源

f.close()

二、上下文管理

with open(r'D:\上海python全栈4期\day08\今日内容',mode='rt',encoding='utf-8') as f:
    # data=f.read()
    # print(data)
    # print('='*100)
        name=input('>>: ')
        for line in f:
            print(line)

一、基本概念

打开文件的模式有三种纯净模式：r（默认的）w a

控制操作文件内容格式的两种模式：t（默认的）b

大前提：tb模式均不能单独使用，必须和纯净模式一起使用

t文本模式：

　　1.读写文件都是以字符串为单位的

　　2.只能针对文本文件

　　3.必须制定encoding参数

b文本模式：

　　1.读写文件都是以Bytes/二进制位单位的

　　2.可以针对所有文件

　　3.一定不能有encoding参数

二、打开文件模式详解：

1.r只读模式：在文件不存在时则报错，文件存在时文件内指针直接跳到文件开头

with open('a.txt',mode='rt',encoding='utf-8') as f:
    print(f.readlines())

用户认证功能
inp_name=input('请输入你的名字: ').strip()
inp_pwd=input('请输入你的密码: ').strip()
with open(r'db.txt',mode='rt',encoding='utf-8') as f:
    for line in f:
        # 把用户输入的名字与密码与读出内容做比对
        u,p=line.strip('\n').split(':')
        if inp_name == u and inp_pwd == p:
            print('登录成功')
            break
    else:
        print('账号名或者密码错误')

2.w只写模式：在文件不存在时会创建空文档，文件存在会清空文件，文件的指针会跳到文件开头

with open('b.txt',mode='wt',encoding='utf-8') as f:
    print(f.writable())
    print(f.readable())
    f.write('你好\n')
    f.write('我好\n') # 强调:在文件不关闭的清空下,后写的内容一定跟着前写内容的后面
    f.write('大家好\n')
    f.write('111\n222\n333\n')

    lines=['1111','22222','33333']
    for line in lines:
        f.write(line)
    f.writelines(lines)

注册功能:
name=input('username>>>: ').strip()
pwd=input('password>>>: ').strip()
with open('db1.txt',mode='at',encoding='utf-8') as f:
    info='%s:%s\n' %(name,pwd)
    f.write(info)

3.a只追加写模式：在文件不存在时会创建空文档，文件存在时，文件指针直接跳到文件末尾

with open('c.txt',mode='at',encoding='utf-8') as f:
    f.write('44444\n')
    f.write('55555\n')
    print(f.readable())
    print(f.writable())

r+ w+ a+
with open('a.txt',mode='r+t',encoding='utf-8') as f:
    print(f.readable())
    print(f.writable())
    print(f.readline())
    f.write('你好啊')

b：读写都是以二进制单位

with open('b.txt',mode='rb') as f:
    data=f.read()
    # print(data,type(data))
    print(data.decode('utf-8'))

with open('1.png',mode='rb') as f:
    data=f.read()
    print(data)


with open('d.txt','wb') as f:
    f.write('你好'.encode('gbk'))


with open('1.png',mode='rb') as f:
    data=f.read()

with open('2.png',mode='wb') as f:
    f.write(data)

# 拷贝工具
src_file=input('源文件路径: ').strip()
dst_file=input('目标文件路径: ').strip()
with open(r'%s' %src_file,mode='rb') as read_f,open(r'%s' %dst_file,mode='wb') as write_f:
    for line in read_f:
        # print(line)
        write_f.write(line)

二、文件指针的操作

大前提：文件内指针的移动是以Bytes为单位的，唯独t模式下的read读取内容个数是以字符为单位

f.read(3)
with open('a.txt',mode='rt',encoding='utf-8') as f:
    data=f.read(3)
    print(data)

with open('a.txt',mode='rb') as f:
    data=f.read(3)
    print(data.decode('utf-8'))

f.seek(指针移动的字节数，模式控制）：控制文件指针的移动

模式控制：

0：默认模式，该模式代表指针移动的字节数是以文件开头为参照的

1：该模式代表指针移动的字节数是以当前所在的位置为参照的

2：该模式代表指针移动的字节数是以文件末尾的位置为参照的

*******强调：其中0模式可以在t或者b模式使用，而1跟2模式只能在b模式使用

f.tell()查看文件指针当前距离文件开头的位置

0模式详解
with open('a.txt',mode='rt',encoding='utf-8') as f:
    f.seek(4,0)
    print(f.tell())
    print(f.read())

with open('a.txt',mode='rb') as f:
    # f.seek(4,0)
    f.seek(2,0)
    print(f.tell())
    print(f.read().decode('utf-8'))


with open('a.txt',mode='rt',encoding='utf-8') as f:
    f.seek(5,0)
    print(f.read())

1模式详解
with open('a.txt',mode='rb') as f:
    f.seek(3,1)
    print(f.tell())
    f.seek(4,1)
    print(f.tell())
    print(f.read().decode('utf-8'))

2模式详解
with open('a.txt',mode='rb') as f:
    f.seek(-9,2)
    data=f.read()
    print(data.decode('utf-8'))

tail -f access.log
with open('access.log',mode='rb') as f:
    f.seek(0,2)
    while True:
        line=f.readline()
        if len(line) == 0:
            # 没有内容
            continue
        else:
            print(line.decode('utf-8'),end='')

三、文件的修改

须知一:
硬盘空间无法修改,硬盘中的数据更新都是用新的内容覆盖旧的内容
内存控制可以修改
with open('a.txt','r+t',encoding='utf-8') as f:
    f.seek(4,0)
    print(f.tell())
    f.write('我擦嘞')

须知二:
文件对应的是硬盘空间,硬盘不能修改应为文件本质也不能修改,
我们看到文件的内容可以修改,是如何实现的呢?
大的的思路:将硬盘中文件内容读入内存,然后在内存中修改完毕后再覆盖回硬盘
具体的实现方式分为两种:
1. 将文件内容发一次性全部读入内存,然后在内存中修改完毕后再覆盖写回原文件
优点: 在文件修改过程中同一份数据只有一份
缺点: 会过多地占用内存
with open('db.txt',mode='rt',encoding='utf-8') as f:
    data=f.read()

with open('db.txt',mode='wt',encoding='utf-8') as f:
    f.write(data.replace('kevin','SB'))

2. 以读的方式打开原文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完后写入临时文件...,删掉原文件,将临时文件重命名原文件名
优点: 不会占用过多的内存
缺点: 在文件修改过程中同一份数据存了两份
import os

with open('db.txt',mode='rt',encoding='utf-8') as read_f,\
        open('.db.txt.swap',mode='wt',encoding='utf-8') as wrife_f:
    for line in read_f:
        wrife_f.write(line.replace('SB','kevin'))

os.remove('db.txt')
os.rename('.db.txt.swap','db.txt')

posted @ 2018-09-19 18:30 Maple_feng 阅读(359) 评论(0) 收藏举报

刷新页面返回顶部

Maple_feng

python哲学思想：“如果看起来像鸭子，听起来像鸭子，就可以把它当作鸭子”。因此python对象的接口力求简单而且统一，类似其他语言中面向接口编程思想。

九、文件的处理

一、文件操作的方法

二、文件指针的操作

三、文件的修改

公告