常见编码方式(码表)
ASCII:美国标准信息交换码
用一个字节的7位可以表示(只有英文、阿拉伯数字以及一些特殊符号)
ISO8859-1(Latin-1):欧洲码表or拉丁码表
用一个字节的8位表示。又称Latin-1(拉丁编码)或“西欧语言”。ASCII码包含的仅仅是英文字母,并且没有完全占满256个编码位置,所以它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入192个字母及符号,借以供使用变音符号的拉丁字母语言使用。从而支持德文、法文等。因而它依然是一个单字节编码,只是比ASCII更全面。
GB2312:中国的中文编码表
(操作系统是中文的,用记事本的时候默认编码方式是gb2312)
GBK:中国的中文编码表升级,融合了更多的中文文字符号。
Unicode:国际标准码,融合了多种文字。
所有文字都用两个字节来表示,Java语言使用的就是Unicode。
UTF-8:最多用三个字节来表示一个字符。
(日后接触最多的就是ISO8859-1、GBK、UTF-8)
ISO8859-1:一个字节
GBK:两个字节,包含了英文字符和扩展的中文
UTF-8:万国码,推行使用的。是1~3个字节不等长。英文存的是1个字节,中文存的是3个字节,是为了节省空间。
如何避免出现乱码?
只要保证编码跟解码时用的同一张码表
计算机是以什么形式保存数据的?
二进制
保存文件的时候 字符=>二进制 编码
浏览器渲染网页 二进制=>字符 解码
sublime默认编码方式就是UTF-8
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!