对计算机的一些认识(一)

  • 关于计算机语言
    •   计算机语言经历了三个发展阶段
      •   机器语言  早期计算机只能通过0和1进行操作。所有的一切指令都只能由01来完成。这种计算机能直接识别的二进制代码称为机器指令。机器指令的集合就是该计算机的机器语言。
      •        符号语言(汇编语言)----暂不说明
      •     高级语言  即目前所熟知的由字母和字符所构成的语言,诸如c#  java  python  PHP等语言。这些语言大部分都是在C语言的基础上所形成的。当然他们要比C语言更加方便。但执行的效率却不如C语言这类底层语言。
  •  ASCII码,GBK Unicode(万国码) utf-8
    •   ASCII码:American Standard Code for International Interchange,美国标准信息交换码,是一套由拉丁文所组成的字符编码系统(二十六个字母以及符号)这些字符都与八位数二进制所表示的数字一一对应。而且满足了对于美国这样国家的编程工作。
    • 在中国只通过字母进行编程工作是行不通的,所以GBK应运而生。GBK即汉字内码扩展规范,K为扩展的汉语拼音中"扩"字的声母。英文全称Chinese Internal Code Specification。GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集--基本集》,1980年由国家标准总局发布。基本集共收入汉字6763个和非汉字图形字符682个,通行于中国大陆。
    • 但这么多国家如果一个国家有一个国家的标准,不就乱套了。为了防止这种现象发生,出现了Unicode--万国码,顾名思义Unicode它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。是计算机科学领域里的一项业界标准,包括字符集、编码方案等。它是为了解决传统的字符编码方案的局限而产生的,当然也起到了巨大的作用。因为Python的诞生比Unicode标准发布的时间还要早,所以最早的Python只支持ASCII编码,普通的字符串'ABC'在Python内部都是ASCII编码的。甚至p2也不支持中文字符。
    • utf-8 utf-8是目前使用最广泛的一种编码模式,UTF-8的特点是对不同范围的字符使用不同长度的编码。对于0x00-0x7F之间的字符,UTF-8编码与ASCII编码完全相同。UTF-8编码的最大长度是6个字节。6字节模板有31个x,即可以容纳31位二进制数字。Unicode的最大码位0x7FFFFFFF也只有31位。所以它起到了很好的兼容作用。
    • Uincode与utf-8的区别
posted @ 2018-08-26 22:00  寒漓  阅读(1304)  评论(0编辑  收藏  举报