文件操作
对文件的操作流程
- 打开文件,得到文件句柄并赋值给一个变量
- 通过句柄对文件进行操作
- 关闭文件
1、字符编码问题
首先,我们先前写好一个文件,并命名为“yesterday.txt”,内容如下:
Somehow, it seems the love I knew was always the most destructive kind 不知为何,我经历的爱情总是最具毁灭性的的那种 Yesterday when I was young 昨日当我年少轻狂 The taste of life was sweet 生命的滋味是甜的 As rain upon my tongue 就如舌尖上的雨露 I teased at life as if it were a foolish game 我戏弄生命 视其为愚蠢的游戏 The way the evening breeze 就如夜晚的微风 May tease the candle flame 逗弄蜡烛的火苗 The thousand dreams I dreamed 我曾千万次梦见 The splendid things I planned 那些我计划的绚丽蓝图 I always built to last on weak and shifting sand 但我总是将之建筑在易逝的流沙上 I lived by night and shunned the naked light of day 我夜夜笙歌 逃避白昼赤裸的阳光 And only now I see how the time ran away 事到如今我才看清岁月是如何匆匆流逝 Yesterday when I was young 昨日当我年少轻狂 So many lovely songs were waiting to be sung 有那么多甜美的曲儿等我歌唱 So many wild pleasures lay in store for me 有那么多肆意的快乐等我享受 And so much pain my eyes refused to see 还有那么多痛苦 我的双眼却视而不见 I ran so fast that time and youth at last ran out 我飞快地奔走 最终时光与青春消逝殆尽 I never stopped to think what life was all about 我从未停下脚步去思考生命的意义 And every conversation that I can now recall 如今回想起的所有对话 Concerned itself with me and nothing else at all 除了和我相关的 什么都记不得了 The game of love I played with arrogance and pride 我用自负和傲慢玩着爱情的游戏 And every flame I lit too quickly, quickly died 所有我点燃的火焰都熄灭得太快 The friends I made all somehow seemed to slip away 所有我交的朋友似乎都不知不觉地离开了 And only now I'm left alone to end the play, yeah 只剩我一个人在台上来结束这场闹剧 Oh, yesterday when I was young 噢 昨日当我年少轻狂 So many, many songs were waiting to be sung 有那么那么多甜美的曲儿等我歌唱 So many wild pleasures lay in store for me 有那么多肆意的快乐等我享受 And so much pain my eyes refused to see 还有那么多痛苦 我的双眼却视而不见 There are so many songs in me that won't be sung 我有太多歌曲永远不会被唱起 I feel the bitter taste of tears upon my tongue 我尝到了舌尖泪水的苦涩滋味 The time has come for me to pay for yesterday 终于到了付出代价的时间 为了昨日 When I was young 当我年少轻狂
上面的代码是想把“yesterday2”文件打开,把内容读出来,让后直接付给data,但是最后报了“
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 105: illegal multibyte sequence
”错误,这个错误是编码错误,我用的是win10系统,它默认的是gbk编码的,而python是以‘UTF-8’编码的,所以它会报编码错误!
那对于此错误我们怎么修改呢?很简单,先上代码
1 data = open("yesterday.txt",encoding="utf-8").read()
我们现在把data数据读出来,如下所示:
其实我们只是多加了encoding = 'UTF-8' 这句话就表示:我们指定比那吗格式为UTF-8,这样我们的问题就得到了解决!虽然这个问题得到了解决,但是新的问题又出现了:我们只能把整个文件一次性都读出来,不能对文件进行增删改查。前面我们说过,对文件的操作,是要对文件句柄进行操作,因此,我们要先把文件句柄,得到,并传给一个变量f:
1 f = open("yesterday2",encoding="utf-8") # 文件句柄,文件的内存对象
我们有了文件的句柄之后,就可以对文件进行操作了:
1 f = open('yesterday2') #打开文件 2 first_line = f.readline() 3 print('first line:',first_line) #读一行 4 print('我是分隔线'.center(50,'-')) 5 data = f.read()# 读取剩下的所有内容,文件大时不要用 6 print(data) #打印文件 7 8 f.close() #关闭文件
以上是对文件的一些基本操作。
其实打开文件的模式有很多种:
打开文件的模式有:
- r,只读模式(默认)。
- w,只写模式。【不可读;不存在则创建;存在则删除内容;】
- a,追加模式。【可读; 不存在则创建;存在则只追加内容;】
"+" 表示可以同时读写某个文件
- r+,可读写文件。【可读;可写;可追加】
- w+,写读
- a+,同a
"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n (与 r 或 r+ 模式同使用)
- rU
- r+U
"b"表示处理二进制文件(如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)
- rb
- wb
- ab
我们来解释几个操作:
1】读文件操作
1 f = open("yesterday2",'r',encoding='utf-8') 2 data = f.read() 3 print(data) 4 f.close()
‘r’,其实对于读,它是默认的,我们不写'r',也是可以进行读文件操作的。
2】写文件操作
1 f = open("yesterday.txt",'w',encoding="utf-8") 2 f.write("I love python!\n")
对于写文件,‘w’,我们要慎用,因为,‘w’它的含义是:首先新建一个“yesterday.txt”文件,然后在文件里面写内容,但是如果,此文件已经存在,那么它将覆盖原先的文件,原先文件里面的内容将全部被覆盖,所以,对此操作,我们因该慎用。
3】追加文件操作
1 f = open("yesterday.txt",'a',encoding="utf-8") 2 f.write("because python is very good!")
‘a’就是在文件的最后增加内容
4】关闭文件操作
1 f.close()
关闭文件操作就很简单了。
最后再讲一个文件指针:
1】tell()
1 f = open("yesterday2",'r',encoding="utf-8") 2 print(f.tell()) # 光标所在位置,索引 3 print(f.readline().strip()) 4 print(f.tell())
2】seek()
1 f = open("yesterday2",'r',encoding="utf-8") 2 print(f.tell()) # 光标所在位置,索引 3 print(f.readline().strip()) 4 print(f.readline().strip()) 5 print(f.tell()) 6 f.seek(0) # 回到0下标 7 print(f.readline().strip()) 8 print(f.tell())