一. 计算机语言基础知识:
1. 编程语言的运行原理:
编程语言是将人能看懂的语言转换成机器可以使用的命令语言的工具。
其中高级语言是程序员经常用的语言类型,包含C语言、C++语言以及Python等我们经常会用到的编辑语言
而高级语言在转换为二进制数字的机器语言之前通常需要先转换为汇编语言。这是一种机器语言的简单翻译版。虽然汇编语言的多数代码都是使用英文单词进行表达的,但是这种语言要比高级语言复杂的多。但是通过这样的语言,我们就可以将我们输入的命令顺利转换成二级制数字传输给CPU进行执行。
高级语言又分为两种:编译型和解释型:
其中:编译型语言是一次写好整体运行,需要先编译成机器语言再执行。具有运行速度快的优点,但是同时,也会耗费大量的时间成本,修改起来困难,跨平台性很差。
解释型语言需要安装解释器才能运行,这种语言再编写的过程中就会自动将代码解释为可运行的机器语言,但是执行的速度会很慢。相反这样的语言编写的时间成本低,且修改容易,跨平台性强。
2. 我们常用的编码:
计算机接受的数据是二进制的数字,每8个二进制的数字组成数据的最小单位,也就是byte,字节。
我们最常使用的就是以1字节进行表示的ascii码。
ascii码可以表示256个字符。支持表示数字,字母和一些特殊字符以及标点符号。
以下是ascii编码表:
但是ascii仅仅可以表示英文,不能表示其他各国语言的字母以及我国的汉字。
所以我国就自己研发出了一套中文编码,GBK
GBK在华销售电脑的默认编码模式,使用2位字节表示一个汉字,可以表达多达65536个字符,支持大部分汉字,繁体字,古汉字,以及周边国家语言,例如:俄语,日语和韩语中的字符。
万国码:Unicode
由于各国间使用的编码不一致,Unicode作为一种包含世界几乎所有地区的字符的编码应运而生。
unicode使用2位字节表达所有的字符,包括汉字,英文字母等都是使用2位字节。这就导致英文字母的要比使用ascii码时多占用一倍的空间。
所以后续又推出了utf-8的升级版本。
utf-8采用浮动位表示不同的语言字符。
例如:中文汉字使用3位字节进行表示,而英文只需要使用1位,欧洲文字使用2位字节。
这样就在很大程度上能节约英文字符的占用空间了。