Go 字符类型

Go语言的字符有两种:

uint8类型,或者叫 byte 型,字符串中的每个元素代表了ASCII码的一个字符
rune类型,代表一个 UTF-8字符。


可以看到string类型中的字符默认为uint8类型,也就是byte类型

再看看字符串长度和实际值:

str中字符串长度和实际输出的长度一致
str2中,输出的长度是12,而实际是包含8个字符,根据utf8编码可知,"你"的编码是E4BDA0,"好"的编码是E5A5BD,各占用3个字节,所以这就是为什么输出长度是12了
再看str2的第一个字符为什么是ä,你的编码是E4BDA0,第一个字节是4E,参照ASCII码对照表可知,4E对应的字符就是ä

从上面可以看出,当我们处理多字节的字符时,得到的并不是我们想要的结果,这个时候就需要用到 rune类型来处理中、日文等其他复合字符


需要将string类型的字符串转换成[]rune数组类型,这样便能正确的处理复合字符,因为rune类型是用utf8编码的;需要注意的是for range遍历字符串是,会先将字符串转成[]rune数组类型,然后再进行遍历

Go用这两种方式处理字符串可能相对来说性能有所提升,但似乎会引起过度底层和复杂的代码。

posted @   学了个江  阅读(326)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 推荐几款开源且免费的 .NET MAUI 组件库
· 实操Deepseek接入个人知识库
· 易语言 —— 开山篇
· Trae初体验
点击右上角即可分享
微信分享提示