Emoji表情符号在MySQL数据库中的存储
文章转自https://www.jianshu.com/p/20740071d854
在Android手机或者iPhone的各种输入法键盘中,会自带一些Emoji表情符号,如IPhone手机系统键盘包含的表情符号有:
如果在移动端发布文本内容时包含了这种Emoji表情符号,通过接口传递到服务器端,服务器端再存入MySQL数据库:
-
对gbk 字符集的数据库,写入数据库的数据,在回显时,变成 ‘口口’ 无法回显;
-
对utf8 字符集的数据库,则根本无法写入数据库,程序直接报出异常信息
java.io.exception xxxxxxxx.
原因分析:
Emoji表情符号为4个字节的字符,而 utf8 字符集只支持1-3个字节的字符,导致无法写入数据库。
解决方案:
-
遍历输入的文本,把四字节长度的字符,修正为自定义的字符替换掉。
-
修改MySQL数据库字符集, 把数据库字符集从utf8 修改为支持1-4 个字节字符的utf8mb4。
事实上可以看出,第一种方案的工作量较大,并不可取。推荐使用第二种方案,修改数据库字符集。从MySQL 5.5.3版本开始,数据库可支持4个字节的utf8mb4 字符集,一个字符最多可以有4个字节,所以能支持更多的字符集,故能存储Emoji表情符号。从 mysql 5.5.3 之后版本基本可以无缝升级到 utf8mb4 字符集。同时,utf8mb4兼容utf8字符集,utf8 字符的编码、位置、存储在utf8mb4与utf8字符集里一样的,不会对有现有数据带来损坏。
升级方案:
-
修改数据库字符集character-set-server=utf8mb4 重启数据库生效。
-
修改database 的字符集为 utf8mb4 alter database dbname character set utf8mb4
-
修改表的字符集 为utf8mb4 , alter table character set = utf8mb4
附上:
Emoji 全编码字符集:IOS Emoji
作者:亦枫
链接:http://www.jianshu.com/p/20740071d854
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。