Go语言中byte类型和rune类型（五）

本篇内容本来准备在上一篇写的，想了想还是拆开写。

go语言中字符串需要使用用双引号，而单引号用来表示单个的字符，字符也是组成字符串的元素。go语言的字符有两种：

ASCII编码是1个字节，而UTF-8是可变长的编码，当要表示中文等非ASCll编码的字符时，需要使用UTF-8编码来保证不会乱码。

举个例子，来遍历打印一个字符串，当使用byte类型时：

func main() {
    str:="hello 世界"
    for i:=0;i<len(str);i++{
        fmt.Printf("%c",str[i]) // hello ä¸ç
    }
}

上面结果，英文字符正确打印，但中文乱码。是因为UTF8编码下一个中文汉字由3~4个字节组成，而字符串是由byte字节组成，所以长度也是byte字符长度，这样遍历时遇到中文就乱码了。

遇到这种带中文的字符串，可以使用go提供的另一个方法来遍历：

func main() {
    str:="hello 世界"
    for _,r:=range str{
        fmt.Printf("%c",r) // hello 世界
    }
}

使用range，其实是使用rune类型来编码的，rune类型用来表示utf8字符，一个rune字符由一个或多个byte组成。

修改字符串

所谓对字符串的修改其实不是对字符串本身的修改，而是复制字符串，同时修改值，即重新分配来内存。

在go中修改字符串，需要先将字符串转化成数组，[]byte 或 []rune，然后再转换成 string型。

对于全是ASCII编码的字符串：

func main() {
    str:="abc"
    s2:=[]byte(str)
    s2[0]='b'
    fmt.Println(string(s2)) //bbc
}

对于包含非ASCII编码的字符串：

func main() {
    str:="白猫"
    s2:=[]rune(str)
    s2[0]='黑'
    fmt.Println(string(s2)) //黑猫
}

上面使用到的 string()，表示强制类型转换，转换为字符串。

本篇主要介绍 byte 和 rune 两种类型的字符，涉及到的for循环和强制类型转换可以简单了解下，有编程基础的很容易懂。

posted @ 2019-09-08 13:32 黑色瓶子阅读(2755) 评论(0) 收藏举报

刷新页面返回顶部