utf-8带bom 获取到utf-8字符串需要加上bom

        
     # 假设源字符串为 utf8_str #utf8_str
= "中文字符串" # 将 utf-8 编码的字符串转换为 utf-8 带 BOM 编码的字符串 #utf8_bom_str = codecs.BOM_UTF8 + utf8_str.encode('utf-8').decode('utf-8-sig') # 打印带 BOM 的 utf-8 编码的字符串 #print(utf8_bom_str.decode('utf-8-sig')) # 将修改后的 HTML 保存到文件 with open(html1, 'w+',encoding='UTF-8-sig') as f: f.write(str(soup)) print("4")

其实直接utf-8-sig就可以了

手动操作就是上面的代码了

python3.8.11

记得import codecs

posted @ 2023-05-06 02:47  三天泪  阅读(142)  评论(0编辑  收藏  举报