第9.4节 Python中用readline读取二进制文件方式打开文件
在《第9.3节 Python的文件内容读取:readline》中介绍了使用readline读取文件的处理,readline除了使用文本文件方式打开文件读外,也可以读取二进制方式打开的文件,但读取的数据返回的是bytes类型,如果涉及中文的处理,这种Bytes类型需要解码以后才能正常显示,一般使用GB2312或GBK模式解码。
下面的案例为用二进制方式打开一个中文文本文件,使用readline读取记录,使用解码前和解码后两种方式输出:
>>> def main():
fp = open(r"c:\temp\test.txt","rb")
while True:
line=fp.readline()
if not line:break
print("解码前:",line)
print('解码后:',line.decode('gbk'))
fp.close()
>>> main()
解码前: b'\xb3\xfc\xd6\xdd\xce\xf7\xbd\xa7\r\n'
解码后: 滁州西涧
解码前: b'[\xcc\xc6] \xce\xa4\xd3\xa6\xce\xef\r\n'
解码后: [唐] 韦应物
解码前: b'\xb6\xc0\xc1\xaf\xd3\xc4\xb2\xdd\xbd\xa7\xb1\xdf\xc9\xfa\xa3\xac\xc9\xcf\xd3\xd0\xbb\xc6\xf0\xbf\xc9\xee\xca\xf7\xc3\xf9\xa1\xa3\r\n'
解码后: 独怜幽草涧边生,上有黄鹂深树鸣。
解码前: b'\xb4\xba\xb3\xb1\xb4\xf8\xd3\xea\xcd\xed\xc0\xb4\xbc\xb1\xa3\xac\xd2\xb0\xb6\xc9\xce\xde\xc8\xcb\xd6\xdb\xd7\xd4\xba\xe1\xa1\xa3\r\n'
解码后: 春潮带雨晚来急,野渡无人舟自横。 >>>
老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython
请大家多多支持,点赞、评论和加关注!谢谢!