python写入csv文件的中文乱码问题
中文乱码
今天练习爬虫,突然心血来潮想要顺便回顾一下csv,运行保存完之后我傻了,全是中文乱码。所以这次解决完后在抓紧记在小本本上~~
好啦,言归正传,先贴代码
with open('test.csv','w',encoding='utf-8',newline='')as csvfile:
writor = csv.writer(csvfile)
new_list = list(x.items())
for i in new_list:
writor.writerow(i)`
在vscode中显示也很正常
但是我打开csv文件时,啪一下就变乱码了,很快啊
这就有点不讲码德了,我说怎么回事?这么一个问题来为难我一个刚入门的小白,这好吗?
解决方案
后来问了问同学,把utf-8改成utf-8-sig就解决了
with open('test.csv','w',encoding='utf-8-sig',newline='')as csvfile:
writor = csv.writer(csvfile)
new_list = list(x.items())
for i in new_list:
print(i)
writor.writerow(i)
utf-8和utf-8-sig
原来是Excel 在读取 csv 文件的时候是通过读取文件头上的 BOM 来识别编码的,如果文件头无 BOM 信息,则默认按照 Unicode 编码读取。而csv默认是ANSI.当我们使用 utf-8 编码来生成 csv 文件的时候,并没有生成 BOM 信息,Excel 就会自动按照 Unicode 编码读取,就会出现乱码问题了。
我这可不是乱说的啊,明显是有备而来(附上两者区别):
1、”utf-8“ 是以字节为编码单元,它的字节顺序在所有系统中都是一样的,没有字节序问题,所以这个不需要BOM,因此用"utf-8"编码方式读取带有BOM的文件时,它会把BOM当做是文件内容来处理,导致出现上述错误
2、“uft-8-sig"中sig全拼为 signature 也就是"带有签名的utf-8”, 多以"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理,与文本内容隔离开,这就是我们需要的结果了
原文:https://blog.csdn.net/weixin_46640900/article/details/110602702.
乞求————永远不是存活的正确方式
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术