mysql数据库表情处理
一、问题产生的原因
mysql数据库用的编码是utf8_general_ci,就是utf-8编码,结果也就报错误了。
为什么会出现这种原因?
因为mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。
二、解决方法
解决方法之一
把你的数据库编码集设置为utf8mb4,无论是数据库还是表,还是字段。虽然会增加存储,但是这个可以忽略不计。
解决方法之二
有句话说得好,问题来了要么解决要么折中解决。如果有些原因你不能修改数据库编码之类的,你可以用java的一些插件,如emoji-java这种emoji表情插件对表情进行特殊处理,然后保存或者去掉表情,这也是一种解决方法
引入包:
<dependency> <groupId>com.vdurmont</groupId> <artifactId>emoji-java</artifactId> <version>5.1.1</version> </dependency>
测试
public class Test { public static void main(String[] args) { String str = "Here is a boy: 👦🏿!"; System.out.println("原始字符为:\n" + str); System.out.println("to aliases 之后:"); System.out.println(EmojiParser.parseToAliases(str)); System.out.println(EmojiParser.parseToAliases(str, EmojiParser.FitzpatrickAction.PARSE)); System.out.println(EmojiParser.parseToAliases(str, EmojiParser.FitzpatrickAction.REMOVE)); System.out.println(EmojiParser.parseToAliases(str, EmojiParser.FitzpatrickAction.IGNORE)); } }
还原:
System.out.println(EmojiParser.parseToHtmlHexadecimal(str)); System.out.println("to html:"); String s = EmojiParser.parseToHtmlDecimal(str, EmojiParser.FitzpatrickAction.PARSE); System.out.println(s); System.out.println("还原:"); System.out.println(EmojiParser.parseToUnicode(s));
附:
某些表情符号支持使用Fitzpatrick修饰符,该修饰符可在5种色调之间进行选择:
修饰符 | 类型 |
---|---|
🏻 | 类型_1_2 |
🏼 | type_3 |
🏽 | type_4 |
🏾 | type_5 |
🏿 | type_6 |
EmojiManager
该EmojiManager
提供一些静态方法通过表情符号,数据库搜索:
getForTag
返回给定标签的所有表情符号getForAlias
返回别名的表情符号getAll
返回所有表情符号isEmoji
检查字符串是否是表情符号containsEmoji
检查字符串是否包含表情符号
您还可以查询元数据:
getAllTags
返回可用标签
或得到一切:
getAll
返回所有表情符号
表情符号模型
Emoji 是一个POJO(普通的Java对象),它提供以下方法:
getUnicode
返回表情符号的unicode表示形式getUnicode(Fitzpatrick)
使用提供的Fitzpatrick修饰符返回表情符号的unicode表示形式。如果表情符号不支持Fitzpatrick修饰符,则此方法将抛出UnsupportedOperationException
。如果提供的Fitzpatrick为null,则此方法将返回表情符号的unicode。getDescription
返回表情符号的(可选)描述getAliases
返回此表情符号的别名列表getTags
返回此表情符号的标签列表getHtmlDecimal
返回表情符号的html十进制表示形式getHtmlHexadecimal
返回表情符号的html十进制表示形式supportsFitzpatrick
如果表情符号支持Fitzpatrick修饰符,则返回true;否则返回false