MySQL 操作命令梳理(4)-中文乱码问题
在平时的mysql运维操作中,经常会碰到插入中文字段后出现乱码的情况,产生中文乱码的原因一般有:
1)mysql的编码格式不对,是latin1编码。强烈推荐将mysql下的编码格式都改为utf8,因为它兼容世界上所有字符!
2)mysql的表的语系设定问题(包含character与collation)
3)客户端程式(例如php)的连线语系设定问题
下面就对Mysql下处理数据表中中文字段乱码问题的操作做一记录:
为了防止后续操作出现乱码现象,最好在创建库或数据表的时候就设置正确的编码。
创建数据库的时候,设置编码格式
1 2 3 4 | mysql> CREATE DATABASE hqsb -> CHARACTER SET utf8 -> COLLATE utf8_general_ci; Query OK, 1 row affected (0.01 sec) |
创建表的时候,设置编码格式
1 2 3 4 5 6 7 | mysql> use hqsb; Database changed mysql> CREATE TABLE haha ( -> id int (10) PRIMARY KEY AUTO_INCREMENT, -> name varchar (64) NOT NULL -> ) ENGINE=InnoDB DEFAULT CHARSET=utf8; Query OK, 0 rows affected (0.02 sec) |
这3个设置好了,基本就不会出问题了,即建库和建表时都使用相同的编码格式。
如果在建库建表的时候没有指明编码格式导致中文乱码,可以通过以下方式进行查询。
1)查看mysql系统默认的编码格式(保证下面查询结果中的所有编码格式都是utf8,有不是的就手动修改!):
a)session范围(临时修改,当前窗口有效)
查看数据库编码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | mysql> show variables like "%char%" ; + --------------------------+----------------------------------+ | Variable_name | Value | + --------------------------+----------------------------------+ | character_set_client | gbk | | character_set_connection | gbk | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | gbk | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/ local /mysql/share/charsets/ | + --------------------------+----------------------------------+ 8 rows in set (0.01 sec) |
手动修改字符集(如上,哪一项不是utf8,就修改哪一项):
1 2 | mysql> SET character_set_filesystem= 'utf8' ; Query OK, 0 rows affected (0.00 sec) |
再次查看是否已修改:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | mysql> show variables like "%char%" ; + --------------------------+----------------------------------+ | Variable_name | Value | + --------------------------+----------------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | utf8 | | character_set_results | utf8 | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/ local /mysql/share/charsets/ | + --------------------------+----------------------------------+ 8 rows in set (0.01 sec) |
如上可以看到字符集已经修改成都是utf8了。但是这里有一个问题,那就是重新打开一个命令窗口然后查看数据编码就又出现上面非utf8的情况。这就需要设置global范围:
b)global范围(临时修改,跨窗口有效)
mysql 设置变量的范围默认是 session 范围。如果设置多个会话的字符集那么需要设置 global 范围:Set [global|session] variables …
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | mysql> set global character_set_filesystem= 'utf8' ; Query OK, 0 rows affected (0.00 sec) mysql> show variables like "%char%" ; +--------------------------+----------------------------------+ | Variable_name | Value | +--------------------------+----------------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | utf8 | | character_set_results | utf8 | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/local/mysql/share/charsets/ | +--------------------------+----------------------------------+ 8 rows in set (0.01 sec) |
当跨会话查看mysql字符集都会看到都是utf8。如果以为这样就万事大吉了的话,那么就大错特错了。
c)设置数据全局范围(全局修改,永久生效)
如上设置后,当数据库重启后,就会发现设置global范围的值又变成latin1了!
修改 mysql 配置文件 /etc/my.cnf
1 2 3 4 5 6 | [mysqld] character- set -server=utf8 [client] default-character- set =utf8 [mysql] default-character- set =utf8 |
如上设置后,重启 mysql 服务,就会发现它的字符集就完全变成 utf8了。
不过需要请注意上面这几个参数配置的位置,不然可能会启动不起来 mysql 服务!
这样,后续创建数据库或表的时候不需要指定字符编码,它默认就是 utf8!
Mysql字符集修改的两点总结:
- 直接在session级别设置mysql的字符编码,这是治标不治本的方法;
- 要从源头上解决这个问题。那就是修改 mysql 默认的配置文件,把它的字符集修改成能够使用中文字符的UTF8才行!
2)查看数据库(比如hqsb)的编码格式:
1 2 3 4 5 6 7 | mysql> show create database hqsb; + ----------+---------------------------------------------------------------+ | Database | Create Database | + ----------+---------------------------------------------------------------+ | hqsb | CREATE DATABASE `hqsb` /*!40100 DEFAULT CHARACTER SET utf8 */ | + ----------+---------------------------------------------------------------+ 1 row in set (0.00 sec) |
如果数据库的编码格式不正确,可以手动修改:
1 2 | mysql> ALTER DATABASE hqsb DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; Query OK, 1 row affected (0.01 sec) |
3)查看数据表(比如haha)的编码格式:
1 2 3 4 5 6 7 8 9 10 11 | mysql> show create table haha; + -------+--------------------------------------------------------------------------------------------------------------------------------------------------------+ | Table | Create Table | + -------+--------------------------------------------------------------------------------------------------------------------------------------------------------+ | haha | CREATE TABLE `haha` ( `id` int (10) NOT NULL AUTO_INCREMENT, ` name ` varchar (64) NOT NULL , PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 | + -------+--------------------------------------------------------------------------------------------------------------------------------------------------------+ 1 row in set (0.00 sec) |
如果数据表的编码格式不正确,可以手动修改:
1 2 | mysql> ALTER TABLE haha DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; Query OK, 0 rows affected (0.01 sec) |
注意:
在客户端(比如xshell)里连接mysql插入数据,最好事先确保编码格式为Utf-8。
关于网页中乱码问题的几点解决办法总结
1 2 3 4 5 6 | 1)将网站编码设为utf-8。 2)如果网站已运作了好久,并有很多旧数据,不能再更改简体中文的设定,那么建议将页面的编码设为GBK。 GBK与GB2312的区别就在于:GBK能比GB2312显示更多的字符,要显示简体码的繁体字,就只能用GBK。 3)编辑 /etc/my .cnf ,在[mysql]段加入default_character_set=utf8; 4)在编写Connection URL时,加上?useUnicode= true &characterEncoding=utf-8参数; 5)在网页代码中加上一个 "set names utf8" 或者 "set names gbk" 的指令,告诉MySQL连线内容都要使用utf8或者gbk; |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· .NET Core 中如何实现缓存的预热?
· 三行代码完成国际化适配,妙~啊~
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?