魅力峰值

导航

mysql数据库表情处理

 

一、问题产生的原因

mysql数据库用的编码是utf8_general_ci,就是utf-8编码,结果也就报错误了。

 

为什么会出现这种原因?

因为mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。

 

二、解决方法

解决方法之一

把你的数据库编码集设置为utf8mb4,无论是数据库还是表,还是字段。虽然会增加存储,但是这个可以忽略不计。

解决方法之二

有句话说得好,问题来了要么解决要么折中解决。如果有些原因你不能修改数据库编码之类的,你可以用java的一些插件,如emoji-java这种emoji表情插件对表情进行特殊处理,然后保存或者去掉表情,这也是一种解决方法

引入包:

<dependency>
  <groupId>com.vdurmont</groupId>
  <artifactId>emoji-java</artifactId>
  <version>5.1.1</version>
</dependency>  

 

测试

public class Test {
    public static void main(String[] args) {
        String str = "Here is a boy: 👦🏿!";
        System.out.println("原始字符为:\n" + str);

        System.out.println("to aliases 之后:");
        System.out.println(EmojiParser.parseToAliases(str));
        System.out.println(EmojiParser.parseToAliases(str, EmojiParser.FitzpatrickAction.PARSE));
        System.out.println(EmojiParser.parseToAliases(str, EmojiParser.FitzpatrickAction.REMOVE));
        System.out.println(EmojiParser.parseToAliases(str, EmojiParser.FitzpatrickAction.IGNORE));
	}
}

  

还原:

  System.out.println(EmojiParser.parseToHtmlHexadecimal(str));
        System.out.println("to html:");
        String s = EmojiParser.parseToHtmlDecimal(str, EmojiParser.FitzpatrickAction.PARSE);
        System.out.println(s);

        System.out.println("还原:");
        System.out.println(EmojiParser.parseToUnicode(s));

 

附:

某些表情符号支持使用Fitzpatrick修饰符,该修饰符可在5种色调之间进行选择:

修饰符类型
🏻 类型_1_2
🏼 type_3
🏽 type_4
🏾 type_5
🏿 type_6

 

EmojiManager

EmojiManager提供一些静态方法通过表情符号,数据库搜索:

  • getForTag 返回给定标签的所有表情符号
  • getForAlias 返回别名的表情符号
  • getAll 返回所有表情符号
  • isEmoji 检查字符串是否是表情符号
  • containsEmoji 检查字符串是否包含表情符号

您还可以查询元数据:

  • getAllTags 返回可用标签

或得到一切:

  • getAll 返回所有表情符号

表情符号模型

Emoji 是一个POJO(普通的Java对象),它提供以下方法:

  • getUnicode 返回表情符号的unicode表示形式
  • getUnicode(Fitzpatrick)使用提供的Fitzpatrick修饰符返回表情符号的unicode表示形式。如果表情符号不支持Fitzpatrick修饰符,则此方法将抛出UnsupportedOperationException如果提供的Fitzpatrick为null,则此方法将返回表情符号的unicode。
  • getDescription 返回表情符号的(可选)描述
  • getAliases 返回此表情符号的别名列表
  • getTags 返回此表情符号的标签列表
  • getHtmlDecimal 返回表情符号的html十进制表示形式
  • getHtmlHexadecimal 返回表情符号的html十进制表示形式
  • supportsFitzpatrick 如果表情符号支持Fitzpatrick修饰符,则返回true;否则返回false

 

 

部分摘录自:http://www.itcodai.com/blog/26

posted on 2019-10-12 13:33  魅力峰值  阅读(1062)  评论(0编辑  收藏  举报