UTF-8

编码规则

0xxxxxxx                文字符号0~127(ASCII)
110xxxxx 10xxxxxx            128~2047
1110xxxx 10xxxxxx 10xxxxxx        2048~65535
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx    65535~0x10ffff

变长编码,每个文字符号用1~4个字节表示。

Go的源文件总是以UTF-8编码,文本字符串也优先采用UTF-8编码。

码点值小于256的文字符号可以写成单个十六进制转义的形式,例如:'A'写成'\x41'
更高的码点必须用\u或\U转义

将字符串转换成Unicode码点序列
r := []rune(string)

posted @ 2018-07-12 16:14  一片湖海  阅读(112)  评论(0编辑  收藏  举报