摘要:
Unicode第8版定义了超过一百种语言文字的12万个字符的码点。天然适合保存单个文字符号的数据类型是int32,为Go语言采用。rune类型作为int32类型的别名。我们可以将文字符号的序列表示成int32值序列,这种表示方式称作UTF-32或UCS-4,每个Unicode码点的编码长度相同,都是 阅读全文
摘要:
编码规则0xxxxxxx 文字符号0~127(ASCII)110xxxxx 10xxxxxx 128~20471110xxxx 10xxxxxx 10xxxxxx 2048~6553511110xxx 10xxxxxx 10xxxxxx 10xxxxxx 65535~0x10ffff变长编码,每个文 阅读全文