utf8编码

参考:

https://blog.csdn.net/liluo_2951121599/article/details/81661630

 

UTF8是可变编码,数字英文都占1个字节,汉字占3个或4个字节。

mysql和MariaDB默认是utf8mb3,一般情况下没有问题,但若保存一些生僻字或颜文字(emoji)则会出错,这时需要utf8mb4,因这为些字符占4个字节

数据库字段设置为utf8mb4后,并不会比utf8mb3占用更多磁盘空间,因为utf8本来就是变长的

 

在https://www.qqxiuzi.cn/bianma/zifuji.php中,输入0001 0000(16进制)以上的uncode码就可查询到4字节的utf8字符,如

00020011 𠀒

00020012 𠀑

0001F606 😆

 

在数据库中,各表、字段varchar字符集要保持一致,否则查询或join时可能会全表扫描,无法利用索引

posted @ 2021-08-10 15:34  81  阅读(788)  评论(0编辑  收藏  举报