Go语言中的rune

1、先看看Go语言存的字符串的表示

写在前面:Go语言中的rune其实就是其他类型的char,它的本质是int32

先举个例子看看字节形式

package main

import "fmt"

func main() {
   s := "hello world 墨玉麒麟"
   //先看看字节组成
   b := []byte(s)
   for _, o := range b {
      fmt.Printf("%X ", o)
   }
}

运行

image-20220614214802064

说明:

输出是68 65 6C 6C 6F 20 77 6F 72 6C 64 20 E5 A2 A8 E7 8E 89 E9 BA 92 E9 BA 9F

英文是用一个字节表示,而中文是三个字节表示 这就是UTF-8b编码 可变长的编码方式

这是ASCII表示法,输出的是16进制的数,我们参考ASCII码一览表就可以看出来他们代表的意思

h是68 e是65 l是6C 空格是20 ... 通过对比ASCII码一览表就能看出来

68 65 6C 6C 6F 20 77 6F 72 6C 64 表示hello world

后面的20 E5 A2 A8 E7 8E 89 E9 BA 92 E9 BA 9F就是表示墨玉麒麟 每三个16进制的数,表示一个中文

再遍历字符串看看

package main

import "fmt"

func main() {
   s := "hello world 墨玉麒麟"
   //先看看字节组成
   b := []byte(s)
   for _, o := range b {
      fmt.Printf("%X ", o)
   }
   fmt.Println()
   for i, ch := range s {//ch就是rune rune就是int32
      fmt.Printf("(%d, %X)", i, ch)
   }
}

运行

image-20220614220002523

输出

(0, 68)(1, 65)(2, 6C)(3, 6C)(4, 6F)(5, 20)(6, 77)(7, 6F)(8, 72)(9, 6C)(10, 64)(11, 20)(12, 58A8)(15, 7389)(18, 9E92)(21, 9E9F)

说明:其实ch就是rune rune就是int32

(0, 68)(1, 65)(2, 6C)(3, 6C)(4, 6F)(5, 20)(6, 77)(7, 6F)(8, 72)(9, 6C)(10, 64)(11, 20)就是hello world

(12, 58A8)就是 对应的字节就是 E5 A2 A8 58A8就是UTF编码E5 A2 A8转成的Unicode编码

(15, 7389)就是 对应的字节就是 E7 8E 89 7389就是UTF编码E7 8E 89转成的Unicode编码

(18, 9E92)就是对应的字节就是 E9 BA 92 9E92就是UTF编码E9 BA 92转成的Unicode编码

(21, 9E9F)就是 对应的字节就是 E9 BA 9F 9E9F就是UTF编码E9 BA 9F转成的Unicode编码

把string转换成rune

package main

import "fmt"

func main() {
   s := "hello world 墨玉麒麟"
   //先看看字节组成
   b := []byte(s)
   for _, o := range b {
      fmt.Printf("%X ", o)
   }
   fmt.Println()
   for i, ch := range s { //ch就是rune rune就是int32

      fmt.Printf("(%d, %X)", i, ch)
   }
   fmt.Println()
   for i, ch := range []rune(s) {
      fmt.Printf("(%d, %c)", i, ch)
   }
}

运行

image-20220614221719472

posted @ 2022-06-14 22:18  南风丶轻语  阅读(746)  评论(0编辑  收藏  举报