说明(2017.3.29):
1. 数字+上下文=信息,如果是做数学运算,就是数字,如果是输出字符串给用户,就是码表字符。
2. ASCII码,共128个数字,128个数字刚好7个二进制位(2的7次方=128),0~127。
※ 位就是位置,一个字节有8个二进制位,计算机运行的最小单位是字节,所以总归都是要把位转换成字节的,
第2位就是把字节转换成8个二进制位的时候,第2个0/1,其中1:1,2:10,3:11,4:100,...,255:11111111(8个1,最左边的1是最高位或第7位,最右边的1是最低位或第0位)。
1个字节表示1个字符(1个字节是8位,8位二进制数表示1个字符)。
数字0到10是48到57,大写字母A是65,小写字母a是97,空格是32。
3. 双字节字符,与ASCII码重合的是一个字节,其他的是两个字节(gb2312国标码,big-5繁体字)
4. unicode码,又称为utf-16,统一编码,任何字符都是两个字节。
5. utf-8,统一转换格式,前128个字符用1个字节,1个汉字用3个字节。
测试:
新建文本文档.txt,输入内容“1a我”,另存为1.txt,编码格式unicode。另存为2.txt,编码格式utf-8。
其中1.txt占8字节,“1a我”分别占1个字节(31,61),还有三个打酱油的(unicode编码不够用,补零)各占1字节,前面两个ff和fe是说明这是个文本文档,各占1字节,共8字节。内容全部删掉后,剩2字节。
然后2.txt占8字节,“1a”各占1字节(31,61),“我”占3字节,前面的ef,bb,fb各占1字节,共8字节。内容全部删掉后,剩3字节。