字符编码及在python中的使用
一、字符编码
概念讲解:
对于文本文件,因为计算机只认识二进制,所以需要一个翻译本来充当媒介让计算机能读懂我们的语言,这个翻译本叫做字符编码表。
发展历史:
1、首先由美国人发明计算机并开发出了ASCII码表
A-Z : 65-90
a-z :97-122
2、当计算机逐渐在世界普及之后,各个国家都创建了各自的字符编码表:中国的GBK等
3、当各个国家交流的时候,会因为各自使用的字符编码表不同,出现乱码的情况,所有开发了unicode万国码,兼容所有国家语言字符,起步就是两个字节来表示字符 。并在后期的优化中发展了其他版本如果utf系列:utf8 utf16 ...。专门用于优化unocide存储问题,英文还是采用一个字节,中文三个字节。通常我们使用的是utf8.
使用讲解:
编码及解码
我们可以在python中编码或是解码
编码:
字符串.encode(内部可以跟上你想使用的字符编码表名称来编码)
解码:
字符串.decode(这里的话需要使用跟编码相同的字符编码表,否则会报错)
python2和python3中的区别
由于python2开发的年代早于unicode万国码,所以python不能识别unicode万国码,因此我们需要在文件的顶端加上# encoding:utf8,并在字符串的前面加上一个u,python3中的默认字符编码是utf8.
python2默认的编码是ASCII
1.文件头
# encoding:utf8
2.字符串前面加u
u'你好啊'
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)