5.云计算&大数据_linux基础知识(4)计算机为何物-个人计算机数据表达方式(与高手暗号的组成)
一.与计算机交流时,使用的数据表达方式
事实上我们的计算机只认识0与1,记录的数据也是只能记录0与1而已,所以计算机常用的数据是二进位的。 但是我们人类常用的数值运算是十进位,文字方面则有非常多的语言,所以需要了解数值与文字的编码,才能更好的与只认识01的高手交流(高手是沙雕,为了高效,心里都有个摩斯密码小本本,例如ascll码)
二.文字编码系统
所谓的『编码系统』可以想成是一个『字码对照表』,他的概念有点像底下的图示:
常用的英文编码表为ASCII系统,这个编码系统中, 每个符号(英文、数字或符号等)都会占用1bytes的记录, 因此总共会有28=256种变化。至於中文字当中的编码系统目前最常用的就是big5这个编码表了。 每个中文字会占用2bytes,理论上最多可以有216=65536,亦即最多可达6万多个中文字。 但是因为big5编码系统并非将所有的位都拿来运用成为对照,所以并非可达这么多的中文字码的。 目前big5仅定义了一万三千多个中文字,很多中文利用big5是无法成功显示的
为了解决这个问题,由国际组织ISO/IEC跳出来制订了所谓的Unicode编码系统, 我们常常称呼的UTF8或万国码,这就是现在高手通用语言小本本。