Mysql插入emoji表情报错java.sql.SQLException: Incorrect string value: '\xF0\x9F\x90\xB8'
背景
今天遇到一个Mysql插入用户信息时报错的问题,报错信息如下
1 | java.sql.SQLException: Incorrect string value: '\xF0\x9F\x90\xB8' for column 'userName' at row 1 |
原因
原因是用户的userName这里录入了emoji表情🐷,而要插入的表中定义的字符集是utf8。
mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。
但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。
解决
我们针对数据库层面全部设置的都是utf8mb4,这有这个表和与之关联的另外两个表才是设置的utf8,所以我们的修改策略是修改这三张表的字符集。
1 | ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; |
但是这种修改方式有一个前提,就是这几张表中是没有历史数据的。如果在更改字符集之前已经存在了历史数据,那么只修改表的字符集的话只会对修改之后新插入的varchar类型数据以utf8mb4进行存储,而之前的记录还是以utf8的形式存储的,这样就造成了一张表中同一个字段既有utf8也有utf8mb4两种编码类型,那么显然这种在生产环境是不允许出现的。
为了避免这个问题,我们需要把这张表里面的所有的varchar类型的字段设置成utf8mb4同时也把表设置成utf8mb4,放在一个ALTER语句中一次更新,避免重复锁表。
1 | ALTER TABLE 表名 CHANGE 字段名 字段名 该字段原来的数据类型 CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; |
一张表修改完了,也要确保与之相关的其他表的字段也需要更新为utf8mb4。比如A表作为主表你已经把唯一主键code改成了utf8mb4,而与之关联的明细表B中的关联字段code还是utf8,那么如果有之前代码里面有join语句的话,因为字符集不一样,那么是不会走索引的。所以变更字符集时也需要留意相关表的字符集是否一致。
本篇文章如有帮助到您,请给「翎野君」点个赞,感谢您的支持。
出处:http://www.cnblogs.com/lingyejun/
若本文如对您有帮助,不妨点击一下右下角的【推荐】。
如果您喜欢或希望看到更多我的文章,可扫描二维码关注我的微信公众号《翎野君》。
转载文章请务必保留出处和署名,否则保留追究法律责任的权利。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构