文件操作
一,文件操作基本流程。
# 1.打开文件,产生文件句柄 # 2.操作文件句柄 # 3.关闭文件句柄 # f1 = open('11.txt',encoding='utf-8', mode='r') # content = f1.read() # print(content) # f1.close() # f1, 文件句柄,文件对象 # 约定俗称: file, f_handle ,file_handle, f_obj ,f1 # open 打开的指令,windows的指令
关闭文件的注意事项:
打开一个文件包含两部分资源:操作系统级打开的文件+应用程序的变量。在操作完毕一个文件时,必须把与该文件的这两部分资源一个不落地回收,回收方法为: 1、f.close() #回收操作系统级打开的文件 2、del f #回收应用程序级的变量 其中del f一定要发生在f.close()之后,否则就会导致操作系统打开的文件还没有关闭,白白占用资源, 而python自动的垃圾回收机制决定了我们无需考虑del f,这就要求我们,在操作完毕文件后,一定要记住f.close() 虽然我这么说,但是很多同学还是会很不要脸地忘记f.close(),对于这些不长脑子的同学,我们推荐傻瓜式操作方式:使用with关键字来帮我们管理上下文 with open('a.txt','w') as f: pass with open('a.txt','r') as read_f,open('b.txt','w') as write_f: data=read_f.read() write_f.write(data)
二,文件编码
f=open(...)是由操作系统打开文件,那么如果我们没有为open指定编码,那么打开文件的默认编码很明显是操作系统说了算了
# windows默认编码方式是gbk, linux默认编码方式是utf-8,mac:utf-8 # f1 = open('11.txt', mode='rb') # content = f1.read() # print(content) # f1.close() # b 模式无需定义编码,主要用于非文字类的文件操作,比如图片,视频 # r rb r+ r+b # w wb w+ w+b # a ab a+ a+b
三,文件读的几种模式
#1. read 全部读出来 # f1 = open('11.txt', mode='r', encoding='utf-8') # print(f1.read()) # f1.close() #1.1 read[n] 指定读取 # f1 = open('11.txt', mode='r',encoding='utf-8') # print(f1.read(12)) #r模式是按照字符去读 # f1.close() # f1 = open('11.txt', mode='rb') # print(f1.read(16)) #rb模式是按照字节去读 # f1.close() #2. readline 按行读取 ''' def readline(self, limit=-1): """Read and return one line from the stream. :type limit: numbers.Integral :rtype: bytes """ return b'' ''' # f1 = open('11.txt', mode='r',encoding='utf-8') # print(f1.readline()) # print(f1.readline()) # f1.close() #3. readlines ''' def readlines(self, hint=-1): """Read and return a list of lines from the stream. :type hint: numbers.Integral :rtype: list[unicode] """ return [] ''' #4. for循环 最后读取大文件的方式,只占一行的内存 # f1 = open('11.txt', 'r', encoding='utf-8') # for n in f1: # print(n)
read(3): 1. 文件打开方式为文本模式时,代表读取3个字符 2. 文件打开方式为b模式时,代表读取3个字节 其余的文件内光标移动都是以字节为单位的如:seek,tell,truncate 注意: 1. seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的 2. truncate是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果。
# seek() tell() # seek(0,2) 指针调到最后 # tell() 告诉指针位置 # f1 = open('11.txt', 'r', encoding='utf-8') # f1.seek(0,2) # print(f1.read())
四、文件的修改
文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,
方式一:将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的
方式二:将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件
#1. 打开文件产生文件句柄 #2. 创建新文件产生文件句柄 #3. 读取源文件,进行修改,写入新文件 #4. 将源文件删除 #5. 将文件命名源文件
import os # low版 # with open('11.txt', 'r', encoding='utf-8') as f1,\ # open('11.bak', 'w', encoding='utf-8') as f2: # old_content = f1.read() # new_content = old_content.replace('我爱你', '我擦了') # f2.write(new_content) # os.remove('11.txt') # os.rename('11.bak', '11.txt') #for循环版 # with open('11.txt', 'r', encoding='utf-8') as f1,\ # open('11.bak', 'w', encoding='utf-8') as f2: # for line in f1: # new_content = line.replace('我擦了', '我爱你') # f2.write(new_content) # os.remove('11.txt') # os.rename('11.bak', '11.txt')
五、练习
1. 文件a.txt内容:每一行内容分别为商品名字,价钱,个数。
apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3
chicken 10 3
通过代码,将其构建成这种数据类型:[{'name':'apple','price':10,'amount':3},{'name':'tesla','price':1000000,'amount':1}......] 并计算出总价钱。
# l1 = [] # sum = 0 # with open('a.txt', 'r', encoding='utf-8') as f1: # for n in f1: # n = n.split() # if n: # sum += int(n[1]) * int(n[2]) # l1.append({"name": n[0], "price": n[1], "amount": n[1]}) # print(sum) # print(l1)
2,有如下文件:
-------
alex是老男孩python发起人,创建人。
alex其实是人妖。
谁说alex是sb?
你们真逗,alex再牛逼,也掩饰不住资深屌丝的气质。
----------
将文件中所有的alex都替换成大写的SB。