JAVA基础---编码解码
所谓编码 即char->byte
所谓解码 即byte->char
ISO-8859-1 中文字符会被黑洞吸收 全部变为"?"
GB2312 汉字可以被编码为双字节 但是该标准仅仅支持6763个汉字 且char到byte需要查表
GBK 与GB2312基本相同 只不过包含更多的汉字
UTF-16 将char强行拆成两个字节 不存在的部分写00 规则简单 编码效率高 缺点浪费了部分存储空间 且一个汉字拆为三个字节
其中一个字符码损坏 后面会受影响 适合在本地磁盘和内存之间使用 不适合网络传输(易损坏字节流 数据经过网络传输时都是以字节为单位的)
UTF-8 对单字节范围内的字符仍然使用1个字节表示,对汉字则采用3个字节表示 更适合在网络传输 且UTF-8在编码效率上和编
码安全性上做了平衡,是理想的中文编码方式
UTF-16 UTF-8都是处理Unicode编码
当采用压缩算法对字符进行压缩时候,不能仅仅看字符数量的减少(这是没意义的),而要重点关注最终的字节数,这还取决于选择的编码方式。
才能这种东西 本来就是靠自己挖掘创造的 我也不是什么天才 我只是比任何人都拼命工作 一步一个脚印走过来了 等我回头一看 背后没有一个身影 那帮懒惰的人在山脚念叨着 谁叫那家伙是天才 开什么玩笑 我最讨厌悠哉悠哉长大的慢性子 比我有时间 有精力 感情丰富的人 为什么比我懒惰 那就给我啊 要把这些东西都浪费掉的话 就通通给我 我还有很多很多想创造的东西 给我啊--------摘自《legal high II》 与诸君共勉