文件处理

文件基本操作

 

1 什么是文件?

    文件是操作系统为用户或应用程序提供的一个读写硬盘的虚拟单位

    文件的操作核心就:读、写

    即我们只需要对于进行读写操作,就是对操作系统发起请求,然后由操作系统将用户或者应用程序

    对文件的读写操作转换成具体的硬盘指令(比如控制盘片转动,控制机械手臂移动来读写数据)

 

2 为什么要有文件?

    因为内存无法永久保存数据,但凡我们想要永久保存数据都需要保存到硬盘中,

    而操作文件就可以实现对硬件的操作

 

3 如何用文件

 name='egon'

 pwd='123'

 把内存中的数据存储到硬盘中去

 

 l=[1,2,3]

 l.append(4)

 l.append(5)

 print(l)

 

 把硬盘中的数据读到内存中

rawstring

f=open(r'E:\SH_fullstack_s2\day08\a.txt',mode='r') # 向操作系统发起请求,要求操作系统打开文件,占用操作系统的资源

 f1=10

 f2='aaaa'

 f2.index()

 print(f)

 y=2

data=f.read() # 向操作系统打开发起读请求,会被操作系统转成具体的硬盘操作,将内容由硬盘读入内存

print(data)

 

 del f

f.close() #向操作系统发起请求,要求操作系统关闭文件,回收系统资源

 print(f)

 f.read()

 

 总结:

1、打开文件

2、读写

3、关闭

 

 

绝对路径与相对路径

1、绝对路径:从盘符(C:\\ E:\\ D:\\)开始写一个完整的路径
2、相对路径:相对于当前执行文件所在的文件夹开始找
f=open(r'a\a.txt')

# 控制读写文件内容的结果有两种:t模式text,b模型bytes
#注意:
#1、t与b这两种模式均不能单独使用,都需要与r/w/a之一连用
#2、默认的内容格式是t
#3、只有文本文件才能用t模式,也只有文本文件才有字符编码的概念

 

 

文件打开方模式

 操作文件的基础模式有三种:
1、r,默认的
2、w
3、a


r:read,只读模式
1、只能读,不能写
2、在文件不存在时,会报错,在文件存在的时候会将文件指针移动到开头
 f=open(r'b.txt',mode='rt',encoding='utf-8')
 data1=f.read()
 print('第一次:',data1)
 print(type(data1))

 data2=f.read()
 print('第二次:',data2)
 f.close()

 f=open(r'b.txt',mode='rt',encoding='utf-8')
 data2=f.read()
 print('第二次:',data2)
 f.close()

 f=open(r'b.txt',mode='rt',encoding='utf-8')
 print(f.readable())
 print(f.readline(),end='')
 print(f.readline(),end='')

 lines=f.readlines()
print(lines)
 f.close()

 

w:只写模式
1、只能写,不能读
2、在文件不存在时会创建空文件,在文件存在的时候会将文件内容清空
 f=open(r'c.txt',mode='wt',encoding='utf-8')
 print(f.readable())
 f.read()
 f.write('你好啊我的天\n你好啊我的地\n啊啊啊啊啊啊\n')
 f.write('4444\n')
 f.write('5555')

 lines=['1111\n','2222\n','33333\n']
 for line in lines:
 f.write(line)
 f.writelines(lines)

 f.close()


a:只追加写模式
1、只能写,不能读
2、在文件不存在时会创建空文件,在文件存在的时候会将指针移动到文件末尾

 f=open('d.txt',mode='at',encoding='utf-8')
 print(f.readable())
 f.read()

 f.write('555555\n6666\n')
 f.writelines(['77777\n','8888888\n','999999999\n'])

 f.close()

b:二进制模式
注意:
1、一定不能指定字符编码,只有t模式才与字符编码有关
2、b是二进制模式,是一种通用的文件读取模式,因为所有的文件在硬盘中都是以二进制形式存放的

 f=open('egon.jpg','rb')
 data=f.read()
 print(type(data))
 f.close()

 f=open('oldsiji.mp4','rb')
 data=f.read()
 f.close()

 f=open(r'F:\oldsiji.mp4','wb')
 f.write(data)
 f.close()


 循环读
 f=open('d.txt','rt',encoding='utf-8')
 for line in f:
 print(line)
 f.close()

 f=open('d.txt','rb')
 for line in f:
 print(line)
 f.close()

 f=open('oldsiji.mp4','rb')
 for line in f:
 print(line)
 f.close()


 f=open('e.txt','wb')
 f.write('你好啊'.encode('utf-8'))

 f.close()


 f=open('e.txt','ab')
 f.write('大家好,我是egon'.encode('utf-8'))
 f.close()


 上下文管理
 with open('e.txt','rb') as f,open('j.txt','wt',encoding='utf-8') as f1:
文件的操作
 src_data=f.read()
 res=src_data.decode('utf-8')
 print(res,type(res))
 f1.write(res)

 

with open('e.txt','rb') as f,\
open('j.txt','wb') as f1:
文件的操作
f1.write(f.read())

 

 可读可写

r+t:可读、可写

 

w+t:可写、可读

 with open('b.txt','w+t',encoding='utf-8') as f:

     print(f.readable())

     print(f.writable())

a+t:可追加写、可读

 

r+b

w+b

a+b

 

 with open('b.txt',mode='rb') as f:

     data=f.read()

     print(data.decode('utf-8'))

 

 with open('b.txt',mode='rt',encoding='utf-8') as f:#     data=f.read()

     print(data)

 

with open('a.txt',mode='r+',encoding='utf-8') as f:

    print(f.readline())

    print(f.readline())

    f.write('小红帽')

 

控制文件指针移动

 

 f.seek(offset,whence)

offset代表文件的指针的偏移量,单位是字节bytes

whence代表参考物,有三个取值

0:参照文件的开头

1:参照当前文件指针所在位置

2: 参照文件末尾

ps:快速移动到文件末尾f.seek(0,2)

 

强调:其中whence=1和whence=2只能在b模式下使用

 f=open('c.txt',mode='rt',encoding='utf-8')

 f.seek(9,0)

 print(f.tell()) # 每次统计都是从文件开头到当前指针所在位置

 print(f.readline())

 

 f.close()

 

 

 f=open('c.txt',mode='rb')

 f.readline()

 f.seek(6,1)

 print(f.readline().decode('utf-8'))

 print(f.tell())

 f.close()

 

 

 f=open('c.txt',mode='rb')

 f.seek(-9,2)

 print(f.readline().decode('utf-8'))

 print(f.tell())

 f.close()

 

 

 

 了解(**)

 只有在t模式下的read(n),n代表的是字符个数,除此之外其他但凡涉及文件指针的移动都是以字节为单位的

 f=open('c.txt',mode='rt',encoding='utf-')

 print(f.read(3))

 f.close()

 

 f=open('c.txt',mode='rb',)

 print(f.read(3).decode('utf-8'))

 f.close()

 

 

 ab a+b r+b

f=open('b.txt',mode='at',)

f.truncate(9) # 参照物永远是文件开头

f.close()

 

 文件修改

 

 with open('c.txt','r+t',encoding='utf-8') as f:

     f.seek(21,0)

     f.write('[我擦勒]')

 

修改文件内容的方式一:

思路:先将原文件内容一次性全部读入内存,然后在内存修改完毕后,再

覆盖写回原文件

优点:在修改期间,文件内容只有一份

缺点:当文件过大的情况下或占用过多的内存空间

 

 with open('d.txt','rt',encoding='utf-8') as read_f:

     msg=read_f.read()

     msg=msg.replace('alex','xiang')

      print(msg)

 

 with open('d.txt','wt',encoding='utf-8') as write_f:

     write_f.write(msg)

 

修改文件内容的方式二:

思路:

1、以读的方式打开原文件,以写的方式打开一个新文件

2、从原文件中循环读取每一行内容修改后写入新文件

3、删除原文件,将新文件重命名为原文件的名字

 

优点:同一时刻只有一行内容存在于内存中

缺点:在修改期间,文件内容始终存在两份,但修改完毕后会只留一份

import os

with open('d.txt','rt',encoding='utf-8') as read_f,\

        open('d.txt.swap','wt',encoding='utf-8') as write_f:

    for line in read_f:

        write_f.write(line.replace('xiang','ALEXSB'))

 

os.remove('d.txt') # 删除老文件

os.rename('d.txt.swap','d.txt')

 

posted on 2018-06-05 22:21  阿乐的博客园  阅读(88)  评论(0编辑  收藏  举报

导航