python操作文件open()方法指定文件编码

  今天在写入文件时候遇到了中文乱码的问题。

  问题描述: 字符串转以utf-8编码的字符数组 bytes,然后使用 bytes.decode("utf-8")写入文件中。html指定为utf-8编码,结果页面出现中文乱码。

  出现问题的原因是因为生成的html文件是以gbk编码存储的,代码如下:

# 在 open 方法中指定 encoding="utf-8" 生成的test.html文件会以 utf-8编码,否则在我的电脑上会以 gbk 编码
with open("test.html", "w", encoding="utf-8") as f:
    f.write(bytes.decode("utf-8"))

 

  记录一下现在浏览器客户端使用的编码由什么标签指定:

# meta 标签, 且包含 http-equiv="Content-Type"  那么content中的charset属性指定浏览器使用的字符集
<meta http-equiv="Content-Type" content="text/html;charset=utf-8">

 

posted @ 2022-05-04 00:15  不要西红柿  阅读(2205)  评论(0编辑  收藏  举报