Go语言规格说明书 之 词汇元素(Lexical elements)

go version go1.11 windows/amd64

 

本文为阅读Go语言中文官网的规则说明书(https://golang.google.cn/ref/spec)而做的笔记,完整的介绍Go语言的 词汇元素。

官文的 词汇元素 的 目录结构 如下:

Lexical elements
  -Comments
  -Tokens
  -Semicolons
  -Identifiers
  -Keywords
  -Operators and punctuation
  -Integer literals
  -Floating-point literals
  -Imaginary literals
  -Rune literals
  -String literals

 

词汇元素:按照我的理解,就是源文件中存在的一些基本元素,无论多么复杂的源文件,都是有基本的词汇元素组成的。

 

下面分别介绍:

-Comments

注释。

单行注释 //;

多行注释 /* 注释内容 */

-Tokens

词汇表。

有四种类别:标识符,关键字,操作符和标点符号,字面量。

从本节后面内容可以知道,Go语言有下面5种字面量:

整数(integer)、浮点数(floating-point)、虚数(imaginary)、字符(rune)、字符串(string)。

-Semicolons

分号。

分号在其它许多语言中作为 结束符 使用,但在Go里面可以省略它。

但在某些情况下是必须的。

-Identifiers

标识符。

有 数字 和 字母 (letters)组成,不能以数字开头。

注意1,这里的 字母 包含 下划线(_),在本规格说明书前面有介绍。

注意2,有一些标识符是Go语言预先就定义好的,不可再次定义,比如关键字,下面是来自官网的列表——比较特别的标记为 红色

Types:
    bool byte complex64 complex128 error float32 float64
    int int8 int16 int32 int64 rune string
    uint uint8 uint16 uint32 uint64 uintptr

Constants:
    true false iota

Zero value:
    nil

Functions:
    append cap close complex copy delete imag len
    make new panic print println real recover

-Keywords

关键字。

接触过的每个编程语言都是有的。Go语言关键字如下——比较特别的标记为 红色

break        default      func         interface    select
case         defer        go           map          struct
chan         else         goto         package      switch
const        fallthrough  if           range        type
continue     for          import       return       var

-Operators and punctuation

操作符和标点符号。

操作符就是进行各种运算的符号了,标点符号就是Go语言开发时用到的标点符号,比如上面介绍的 分号。

+    &     +=    &=     &&    ==    !=    (    )
-    |     -=    |=     ||    <     <=    [    ]
*    ^     *=    ^=     <-    >     >=    {    }
/    <<    /=    <<=    ++    =     :=    ,    ;
%    >>    %=    >>=    --    !     ...   .    :
     &^          &^=

常见操作符:加减乘除、赋值、位运算、逻辑运算、关系运算;

特别的:

:= 快捷赋值,在函数体内使用;

... 尚不清楚;

奇怪,没有反引号(`)——Tab键上方那个,英文状态下输入。用来包含 原始字符串字面量。

-Integer literals

整数字面量。

十进制、八进制、十六进制 的整数字面量。

-Floating-point literals

浮点数字面量。

从前面的Go语言关键字可以知道,Go有两种浮点数:float32、float64,32、64表示二进制位数。

可由四部分组成:整数、小数点、小数、指数。其中,只有小数点不可获取。

下面是官网的示例:

0.
72.40
072.40  // == 72.40
2.71828
1.e+0
6.67428e-11
1E6
.25
.12345E+5

-Imaginary literals

虚数字面量。

Go语言支持 复数(complex),复数 由实部和虚部组成。这个虚数字面量特指虚部。

Go语言有两个复数类型:complex64、complex128,分别对应浮点数类型float32、float64,因为浮点数的实部、虚部的数的部分都是浮点数,且类型相同。

下面是官文的叙述字面量示例:

0i
011i  // == 11i
0.i
2.71828i
1.e+0i
6.67428e-11i
1E6i
.25i
.12345E+5i

特别注意,浮点数字面量、复数字面量 是不支持八进制、十六进制的,全部是十进制。请查看上面给出的两种字面量示例中加单行注释(//)所在行的值。

-Rune literals

字符字面量(词霸翻译为 符文)。

一开始的时候,被Rune这个单词弄晕了,不知道是什么,多看了几遍,哦,原来是字符字面量啊!

官文解释:一个代表 Unicode码点 的整数值。使用 单引号 包含。

注意1,Go语言支持的Unicode字符的范围;

注意2,反斜杠的使用;

下面是是官文的示例:注意其中的illegal所在行,单引号中的部分都无法被识别为 Unicode字符,所以,非法。

'a'
'ä'
'本'
'\t'
'\000'
'\007'
'\377'
'\x07'
'\xff'
'\u12e4'
'\U00101234'
'\''         // rune literal containing single quote character
'aa'         // illegal: too many characters
'\xa'        // illegal: too few hexadecimal digits
'\0'         // illegal: too few octal digits
'\uDFFF'     // illegal: surrogate half
'\U00110000' // illegal: invalid Unicode code point

-String literals

字符串字面量。

字符串,就是字符的序列,字符就是上面说的Rune literals。

有两种形式:原始字符串字面量(raw string literals)、解释型字符串字面量(interpreted string literals)。

原始字符串字面量 放在 反引号(back quotes,`)中,前面有提到;

解释型字符串字面量 放在 双引号(double quotes)中;

原始字符串字面量 注意事项(3个):反斜杠没有特殊意义——不是转义字符;可以包含换行符(\n),即支持多行;出现在原始字符串字面量中的回车符(\r)会被直接丢弃。

当然,没有特殊字符时,原始字符串字面量 和 解释型字符串字面量 的值是相同的。

下面是官文的字符串字面量的示例——注意其中包含 \u、\U的:

`abc`                // same as "abc"
`\n
\n`                  // same as "\\n\n\\n"
"\n"
"\""                 // same as `"`
"Hello, world!\n"
"日本語"
"\u65e5本\U00008a9e"
"\xff\u00FF"
"\uD800"             // illegal: surrogate half
"\U00110000"         // illegal: invalid Unicode code point

官文示例——表示相同的字符串字面量:

"日本語"                                 // UTF-8 input text
`日本語`                                 // UTF-8 input text as a raw literal
"\u65e5\u672c\u8a9e"                    // the explicit Unicode code points
"\U000065e5\U0000672c\U00008a9e"        // the explicit Unicode code points
"\xe6\x97\xa5\xe6\x9c\xac\xe8\xaa\x9e"  // the explicit UTF-8 bytes

无论那种,Go编译器处理的 都是 字符串字面量,怎么用它们,需要开发者自行斟酌。

 

好了,本文就介绍到这里,更多、更准确的内容,请参考官文。

如有错误,还请指出,非常感谢!

 

posted @ 2018-09-12 15:28  快乐的欧阳天美1114  阅读(714)  评论(0编辑  收藏  举报