Python读取内容UnicodeDecodeError错误

1、错误现象

环境：Python3.7

描述：

用open方法获取文件句柄；
用read/readlines方法一次读取文件所有内容；
尝试了编码GB2312/GBK/GB18030/UTF-8，发现UnicodeDecodeError报错没有解决。
查看读取的文件。是txt的文件，文件大小30-50MB左右。
用notepad++打开这个文件，发现正常打开，发现编码是GB2312

下面是报错过程：

Python 3.7.2 (tags/v3.7.2:9a3ffc0492, Dec 23 2018, 23:09:28) [MSC v.1916 64 bit (AMD64)]
Type 'copyright', 'credits' or 'license' for more information
IPython 7.3.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]: f = open('test.txt', encoding='GB2312')

In [2]: lines = f.readlines()
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-2-d1e99c5e7da7> in <module>
----> 1 lines = f.readlines()

UnicodeDecodeError: 'gb2312' codec can't decode byte 0xf4 in position 7927: illegal multibyte sequence

2、资料查阅

查阅资料过程：

UnicodeDecodeError为关键字查阅资料。发现几乎所有资料都是指定encoding。
查阅python官方文档。文档中关于open方法的说明。然后发现有参数errors。这个参数默认是strict，即有异常即报错。官方文档说明可以设置为ignore，这样忽略错误。

3、错误解决

解决的python代码：

  1: In [3]: f = open('test.txt', encoding='GB2312', errors='ignore')

2:

  3: In [4]: l = f.readlines()

4:

  5: In [5]:

4、回顾

这个问题困扰了我将近半天的时间，发现尝试编码不能解决后，就做别的事情去了。过了一会儿突然就想看看官方说明，然后就发现了官方文档的解决办法。

所以觉得官方文档真的是一个取之不尽用之不竭的宝库。遇到问题多看官方文档，这是一个好习惯。

5、参考

官方参考文档：

open方法的官方说明：https://docs.python.org/3/library/functions.html#open
open方法支持的编码说明：https://docs.python.org/3/library/codecs.html#module-codecs
关于open方法获取的文件句柄报错处理的参考：https://docs.python.org/3/library/codecs.html#codec-base-classes

posted @ 2019-03-17 23:54 mehome 阅读(1402) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 上周热点回顾（3.3-3.9）
· winform 绘制太阳，地球，月球运作规律

公告

Rollinig In the Deep - Adele

00:00 / 00:00

An audio error has occurred.

1 Rollinig In the Deep Adele

昵称： mehome
园龄： 9年8个月
粉丝： 30
关注： 9

+加关注

2025年3月

日

一

二

三

四

五

六

mehome

当绝望的时候，当想放弃的时候，说明离目标又近了一步。坚持！

Python读取内容UnicodeDecodeError错误

1、错误现象

2、资料查阅

3、错误解决

4、回顾

5、参考

公告

搜索

随笔分类 (64)

随笔档案 (64)

个人链接

推荐排行榜