Go语言中的rune
1、先看看Go语言存的字符串的表示
写在前面:Go语言中的rune其实就是其他类型的char,它的本质是int32
先举个例子看看字节形式
package main
import "fmt"
func main() {
s := "hello world 墨玉麒麟"
//先看看字节组成
b := []byte(s)
for _, o := range b {
fmt.Printf("%X ", o)
}
}
运行
说明:
输出是68 65 6C 6C 6F 20 77 6F 72 6C 64 20 E5 A2 A8 E7 8E 89 E9 BA 92 E9 BA 9F
英文是用一个字节表示,而中文是三个字节表示 这就是UTF-8b编码 可变长的编码方式
这是ASCII表示法,输出的是16进制的数,我们参考ASCII码一览表就可以看出来他们代表的意思
h是68 e是65 l是6C 空格是20 ... 通过对比ASCII码一览表就能看出来
68 65 6C 6C 6F 20 77 6F 72 6C 64 表示hello world
后面的20 E5 A2 A8 E7 8E 89 E9 BA 92 E9 BA 9F就是表示墨玉麒麟 每三个16进制的数,表示一个中文
再遍历字符串看看
package main
import "fmt"
func main() {
s := "hello world 墨玉麒麟"
//先看看字节组成
b := []byte(s)
for _, o := range b {
fmt.Printf("%X ", o)
}
fmt.Println()
for i, ch := range s {//ch就是rune rune就是int32
fmt.Printf("(%d, %X)", i, ch)
}
}
运行
输出
(0, 68)(1, 65)(2, 6C)(3, 6C)(4, 6F)(5, 20)(6, 77)(7, 6F)(8, 72)(9, 6C)(10, 64)(11, 20)(12, 58A8)(15, 7389)(18, 9E92)(21, 9E9F)
说明:其实ch就是rune rune就是int32
(0, 68)(1, 65)(2, 6C)(3, 6C)(4, 6F)(5, 20)(6, 77)(7, 6F)(8, 72)(9, 6C)(10, 64)(11, 20)就是hello world
(12, 58A8)就是墨
对应的字节就是 E5 A2 A8 58A8就是UTF编码E5 A2 A8转成的Unicode编码
(15, 7389)就是玉
对应的字节就是 E7 8E 89 7389就是UTF编码E7 8E 89转成的Unicode编码
(18, 9E92)就是麒
对应的字节就是 E9 BA 92 9E92就是UTF编码E9 BA 92转成的Unicode编码
(21, 9E9F)就是麟
对应的字节就是 E9 BA 9F 9E9F就是UTF编码E9 BA 9F转成的Unicode编码
把string转换成rune
package main
import "fmt"
func main() {
s := "hello world 墨玉麒麟"
//先看看字节组成
b := []byte(s)
for _, o := range b {
fmt.Printf("%X ", o)
}
fmt.Println()
for i, ch := range s { //ch就是rune rune就是int32
fmt.Printf("(%d, %X)", i, ch)
}
fmt.Println()
for i, ch := range []rune(s) {
fmt.Printf("(%d, %c)", i, ch)
}
}
运行