Fork me on GitHub

逆水行舟,不进则退

人与人之间最小的差距是智商,最大的差距是坚持。

python学习日记(文件操作)

文件操作概述

计算机系统分为:操作系统,计算机硬件,应用程序。

我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,这就涉及到应用程序要操作硬件,众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久的保存下来。

读文件

#相对路径下创建的log文件,也可以绝对路径,不过要写完整路径名
f = open('log',mode='r',encoding='utf-8')#以什么编码方式创建的,以什么编码方式读出来
l = f.read()
print(l)
f.close()   #文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
            # 并且操作系统同一时间能打开的文件数量也是有限的

 

 写文件

f = open('log',mode='w',encoding='utf-8')#写入的话是先清空原有内容,再写入新的数据,若文件不存在,创建新文件
f.write('这是新写入的内容')
f.close()
#对写完新内容的文件进行读取
f = open('log',mode='r',encoding='utf-8')#以什么编码方式创建的,以什么编码方式读出来
l = f.read()
print(l)
f.close()   #文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
            # 并且操作系统同一时间能打开的文件数量也是有限的

追加内容

#对文件进行追加内容,指针在文件末尾,若文件不存在,创建新文件
f = open('log',mode='a',encoding='utf-8')
f.write('---这是追加的内容')
f.close()
#对追加完内容的文件进行读取
f = open('log',mode='r',encoding='utf-8')#以什么编码方式创建的,以什么编码方式读出来
l = f.read()
print(l)
f.close()   #文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
            # 并且操作系统同一时间能打开的文件数量也是有限的

二进制文件

前面讲的默认都是读取文本文件,并且是以utf-8编码的文本文件。要读取二进制文件,比如,图片、视频等,用'rb' 模式打开即可。非文本文件

rb

一、

f = open('log',mode='w',encoding='utf-8')#写入的话是先清空原有内容,再写入新的数据
f.write('abcd123')
f.close()
f = open('log',mode='rb')#bytes类型,非文本文件等
l = f.read()
print(l)
f.close()   #文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
            # 并且操作系统同一时间能打开的文件数量也是有限的

二、汉字

f = open('log',mode='w',encoding='utf-8')#写入的话是先清空原有内容,再写入新的数据
f.write('这是五个字')
f.close()
f = open('log',mode='rb')#bytes类型,非文本文件等
l = f.read()
print(l)
f.close()   #文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
            # 并且操作系统同一时间能打开的文件数量也是有限的

wb

一、

f = open('log',mode='wb')#写入的话是先清空原有内容,再写入新的数据,若文件不存在,创建新文件
f.write('abcde'.encode('utf-8'))#涉及到str-->bytes
f.close()
f = open('log',mode='r')
l = f.read()
print(l,type(l))#自动帮你转换成str
f.close()   #文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
            # 并且操作系统同一时间能打开的文件数量也是有限的

二、汉字

f = open('log',mode='wb')#写入的话是先清空原有内容,再写入新的数据,若文件不存在,创建新文件
f.write('三个字'.encode())#涉及到str-->bytes,编码方式默认是utf-8
f.close()
f = open('log',mode='r',encoding='utf-8')
l = f.read()
print(l,type(l))#自动帮你转换成str
f.close()   #文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
            # 并且操作系统同一时间能打开的文件数量也是有限的

ab

同理,不再赘述。

读写r+

一、先读再写

f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
print(f.read())#读完,光标移动到最后,写才没有覆盖
f.write('123')
f.close() 

 二、先写再读

f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
f.write('456')#指针在文件开头
print(f.read())
f.close() 

写完之后,指针在‘456’的后面,然后执行读,读的是当前指针之后的字符串。

w+

打开一个文件用于读写,并从头开始编辑,即原有内容会被删除,若文件不存在,创建新文件。

f = open('log',mode='w+',encoding='utf-8')#打开一个文件用于读写
f.write('456')#指针在文件开头
print(f.read())#指针已经到了最后,所以读是无输出的 
f.close()

a+

打开一个文件用于读写,文件已存在,指针在文件末尾,不存在,创建新文件。

f = open('log',mode='a+',encoding='utf-8')#打开一个文件用于读写
f.write('追加的')#指针在文件末尾
print(f.read())#追加,所以读无输出
f.close() 

二进制文件

同理。

seek (字节)

一、

f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
print(f.read())
f.close()

f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
f.seek(3)#指针移到3,指定光标位置
print(f.read())
f.close()

二、

f = open('log',mode='w',encoding='utf-8')
f.write('晴川历历汉阳树')
f.close()
f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
f.seek(3)#seek单位是字节,一个中文三个字节
print(f.read())
f.close()

对于中文,不是3的整数倍,就会引发异常。

tell(字节)

一、

f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
f.seek(3)#指针移到3,指定光标位置
print(f.tell())#找到指针当前位置,seek指定的为3
print(f.read())
f.close()

二、

f = open('log',mode='w',encoding='utf-8')
f.write('晴川Abc')
f.close()
f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
f.seek(3)#seek单位是字节,一个中文三个字节
print(f.read(2))#从当前指针位置读取几个字符
print(f.tell())#tell单位是字节,找到指针当前位置
f.close()

read(字符)

f = open('log',mode='w',encoding='utf-8')
f.write('晴川abc历历汉阳树')
f.close()
f = open('log',mode='r+',encoding='utf-8')#打开一个文件用于读写
f.seek(3)#seek单位是字节,一个中文三个字节
print(f.read(3))#从当前指针位置读取几个字符
f.close()

with ... as...

可以省去.close()

with open('log',mode='r+',encoding='utf-8') as f1,\
    open('log',mode='a+',encoding='utf-8') as f2:#\可以用来换行
    l1 = f1.read()
    print(l1)
    f2.write('汉阳树')#此时指针在末尾
    f2.seek(0)
    l2 = f2.read()
    print(l2)

readline(),readlines()

with open('log',mode='w+',encoding='utf-8') as f1,\
    open('log',mode='r+',encoding='utf-8') as f2:
    f1.write('晴川历历汉阳树\n芳草萋萋鹦鹉洲')
    f1.seek(0)
    print(f2.read())
    f2.seek(0)
    print('########分界线#######')
    print(f2.readline(),end='\n')#只能读取一行
    f2.seek(0)
    print(f2.readlines())#读取多行,并且是一个列表

注:列表可以用for循环读取。

truncate(size)

从文件的首行字符开始截断,截断文件为size个字节,无size表示从当前位置截断,截断之后后面的所有字符被删除。

f = open('log',mode='w+',encoding='utf-8')
f.write('晴川历历汉阳树,芳草萋萋鹦鹉洲')
f.truncate(3)#按字节,一个中文三个字节,否则引发异常
f.seek(0)
print(f.read())
f.close()

f = open('log',mode='w+',encoding='utf-8')
f.write('晴aaa川历历汉阳树,芳草萋萋鹦鹉洲')
f.truncate(5)#按字节,一个中文三个字节,否则引发异常
f.seek(0)
print(f.read())
f.close()

编码

编码概述

在计算机内存中,统一使用unicode编码,当需要保存到硬盘中或者需要传输的时候,就转换为UTF-8编码。

用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把unicode转换为utf-8保存到文件:

浏览网页的时候,服务器会把动态生成的unicode内容转换为utf-8再传输到浏览器:

#str --->bytes  encode 编码
s = '李白'#字符串是unicode
b = s.encode('utf-8')#编码成其他编码方式用来保存或传输
print(b,type(b))
#bytes --->str decode 解码
s1 = b.decode('utf-8')
print(s1,type(s1))

s = 'aaa'
b = s.encode('utf-8')#编码
print(b,type(b))
#bytes --->str decode 解码
s1 = b.decode('gbk')
print(s1,type(s1))

pass

posted @ 2018-11-23 19:12  咕噜牛Gruffalo  阅读(186)  评论(0编辑  收藏  举报