Go语言规格说明书之词汇元素（Lexical elements）

go version go1.11 windows/amd64

本文为阅读Go语言中文官网的规则说明书（https://golang.google.cn/ref/spec）而做的笔记，完整的介绍Go语言的词汇元素。

官文的词汇元素的目录结构如下：

Lexical elements
-Comments
-Tokens
-Semicolons
-Identifiers
-Keywords
-Operators and punctuation
-Integer literals
-Floating-point literals
-Imaginary literals
-Rune literals
-String literals

词汇元素：按照我的理解，就是源文件中存在的一些基本元素，无论多么复杂的源文件，都是有基本的词汇元素组成的。

下面分别介绍：

-Comments

注释。

单行注释 //；

多行注释 /* 注释内容 */

-Tokens

词汇表。

有四种类别：标识符，关键字，操作符和标点符号，字面量。

从本节后面内容可以知道，Go语言有下面5种字面量：

整数（integer）、浮点数（floating-point）、虚数（imaginary）、字符（rune）、字符串（string）。

-Semicolons

分号。

分号在其它许多语言中作为结束符使用，但在Go里面可以省略它。

但在某些情况下是必须的。

-Identifiers

标识符。

有数字和字母（letters）组成，不能以数字开头。

注意1，这里的字母包含下划线（_），在本规格说明书前面有介绍。

注意2，有一些标识符是Go语言预先就定义好的，不可再次定义，比如关键字，下面是来自官网的列表——比较特别的标记为红色：

Types:
    bool byte complex64 complex128 error float32 float64
    int int8 int16 int32 int64 rune string
    uint uint8 uint16 uint32 uint64 uintptr

Constants:
    true false iota

Zero value:
    nil

Functions:
    append cap close complex copy delete imag len
    make new panic print println real recover

-Keywords

关键字。

接触过的每个编程语言都是有的。Go语言关键字如下——比较特别的标记为红色：

break        default      func         interface    select
case         defer        go           map          struct
chan         else         goto         package      switch
const        fallthrough  if           range        type
continue     for          import       return       var

-Operators and punctuation

操作符和标点符号。

操作符就是进行各种运算的符号了，标点符号就是Go语言开发时用到的标点符号，比如上面介绍的分号。

+    &     +=    &=     &&    ==    !=    (    )
-    |     -=    |=     ||    <     <=    [    ]
*    ^     *=    ^=     <-    >     >=    {    }
/    <<    /=    <<=    ++    =     :=    ,    ;
%    >>    %=    >>=    --    !     ...   .    :
     &^          &^=

常见操作符：加减乘除、赋值、位运算、逻辑运算、关系运算；

特别的：

:= 快捷赋值，在函数体内使用；

... 尚不清楚；

奇怪，没有反引号（`）——Tab键上方那个，英文状态下输入。用来包含原始字符串字面量。

-Integer literals

整数字面量。

十进制、八进制、十六进制的整数字面量。

-Floating-point literals

浮点数字面量。

从前面的Go语言关键字可以知道，Go有两种浮点数：float32、float64，32、64表示二进制位数。

可由四部分组成：整数、小数点、小数、指数。其中，只有小数点不可获取。

下面是官网的示例：

0.
72.40
072.40  // == 72.40
2.71828
1.e+0
6.67428e-11
1E6
.25
.12345E+5

-Imaginary literals

虚数字面量。

Go语言支持复数（complex），复数由实部和虚部组成。这个虚数字面量特指虚部。

Go语言有两个复数类型：complex64、complex128，分别对应浮点数类型float32、float64，因为浮点数的实部、虚部的数的部分都是浮点数，且类型相同。

下面是官文的叙述字面量示例：

0i
011i  // == 11i
0.i
2.71828i
1.e+0i
6.67428e-11i
1E6i
.25i
.12345E+5i

特别注意，浮点数字面量、复数字面量是不支持八进制、十六进制的，全部是十进制。请查看上面给出的两种字面量示例中加单行注释（//）所在行的值。

-Rune literals

字符字面量（词霸翻译为符文）。

一开始的时候，被Rune这个单词弄晕了，不知道是什么，多看了几遍，哦，原来是字符字面量啊！

官文解释：一个代表 Unicode码点的整数值。使用单引号包含。

注意1，Go语言支持的Unicode字符的范围；

注意2，反斜杠的使用；

下面是是官文的示例：注意其中的illegal所在行，单引号中的部分都无法被识别为 Unicode字符，所以，非法。

'a'
'ä'
'本'
'\t'
'\000'
'\007'
'\377'
'\x07'
'\xff'
'\u12e4'
'\U00101234'
'\''         // rune literal containing single quote character
'aa'         // illegal: too many characters
'\xa'        // illegal: too few hexadecimal digits
'\0'         // illegal: too few octal digits
'\uDFFF'     // illegal: surrogate half
'\U00110000' // illegal: invalid Unicode code point

-String literals

字符串字面量。

字符串，就是字符的序列，字符就是上面说的Rune literals。

有两种形式：原始字符串字面量（raw string literals）、解释型字符串字面量（interpreted string literals）。

原始字符串字面量放在反引号（back quotes，`）中，前面有提到；

解释型字符串字面量放在双引号（double quotes）中；

原始字符串字面量注意事项（3个）：反斜杠没有特殊意义——不是转义字符；可以包含换行符（\n），即支持多行；出现在原始字符串字面量中的回车符（\r）会被直接丢弃。

当然，没有特殊字符时，原始字符串字面量和解释型字符串字面量的值是相同的。

下面是官文的字符串字面量的示例——注意其中包含 \u、\U的：

`abc`                // same as "abc"
`\n
\n`                  // same as "\\n\n\\n"
"\n"
"\""                 // same as `"`
"Hello, world!\n"
"日本語"
"\u65e5本\U00008a9e"
"\xff\u00FF"
"\uD800"             // illegal: surrogate half
"\U00110000"         // illegal: invalid Unicode code point

官文示例——表示相同的字符串字面量：

"日本語"                                 // UTF-8 input text
`日本語`                                 // UTF-8 input text as a raw literal
"\u65e5\u672c\u8a9e"                    // the explicit Unicode code points
"\U000065e5\U0000672c\U00008a9e"        // the explicit Unicode code points
"\xe6\x97\xa5\xe6\x9c\xac\xe8\xaa\x9e"  // the explicit UTF-8 bytes

无论那种，Go编译器处理的都是字符串字面量，怎么用它们，需要开发者自行斟酌。

好了，本文就介绍到这里，更多、更准确的内容，请参考官文。

如有错误，还请指出，非常感谢！

posted @ 2018-09-12 15:28 快乐的欧阳天美1114 阅读(745) 评论(0) 收藏举报

刷新页面返回顶部

`三一三`

用问题刺激思想，用执行消灭懒散，

Go语言规格说明书之词汇元素（Lexical elements）

公告

`三一三`

用问题刺激思想，用执行消灭懒散，

Go语言规格说明书 之 词汇元素（Lexical elements）

公告

Go语言规格说明书之词汇元素（Lexical elements）