字符编码
字符串类型、文本文件的内容都是由字符组成的,但凡涉及到字符的存取,都需要考虑字符编码的问题。
人类在与计算机交互时,用的都是人类能读懂的字符,如中文字符、英文字符、日文字符等
而计算机只能识别二进制数
翻译的过程必须参照一个特定的标准,该标准称之为字符编码表,该表上存放的就是字符与数字一一对应的关系。
0 a
1 b
00 aa
01 ab
000
001
0 10
字符编码的发展史
1. 一家独大:
计算机起源于美国,所以,最开始的时候,计算机只考虑了英文字符
ASCII码表:
'''
1、只有英文字符与数字的一一对应关系
2、一个英文字符对应1Bytes,1Bytes=8bit,8bit最多包含256个数字,可以对应256个字符,足够表示所有英文字符
0 : 48
A :65
a : 97
'''
2 . 群雄割据
为了让计算机能够识别中文和英文,中国人定制了GBK
GBK编码:
1 、只有中文字符、英文字符与数字的一一对应关系
2 、 一个中文字符使用两个或者两个以上的bytes 记录
2bytes = 16 位
16 位可以表示 2 ** 16 种情况
'''
如果超过了2 ** 16,gbk就会使用一个中文字符用3个字节表示
'''
1 、只有日文字符、英文字符与数字的一一对应关系
1 、只有韩文字符、英文字符与数字的一一对应关系
3. 分久必合
为了让世界各国的字符统一起来,就诞生了unicode编码
unicode(万国码): 统一使用2 个字节进行表示
eg:adsadsadsadsadsad
utf-8 编码(unicode的优化版本)
'''
把英文字符还按照一个字节表示
中文字符还按照2个字节或者更多字节表示
'''
得出结论:以后我们都使用utf-8 编码
字符编码的差异
1. 如何解决乱码问题
切换对应的编码
2. python解释器版本不同代码的差异
python2
python3
'''
python2诞生的时候,还没有utf8的编码,所以,python2中不能使用utf8的编码
'''
3. pycharm如何添加模板注释
settings
editor
file and code templates
python script
在这个里面写你想添加的内容
4. 编码与解码
编码:
解码
如何操作?
s = '你好啊,世界'
s1 = s.encode('utf8' )
s2 = s1.decode('utf8' )
print (s2)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY