📂MySQL

🔖字符集 mysql

2020-04-13 13:34阅读: 2078评论: 0推荐: 0

mysql不同字符集的转换过程

一、概述及字符集

在工作中，有时我们会遇到更换数据库字符集的问题，那如何正确更换数据库的字符集呢？更换之后数据库的数据不会出现乱码，下面简单讲解一下数据库不同字符集的转换过程。

1.1 需要更换字符集的场景

1、原有数据库的字符集由于前期规划不足，随着业务的发展不能满足业务的需求。如原来业务系统用的是utf8字符集，后期有存储表情符号的需求，uft8字符集就不能满足此时的业务需求了。需要用utf8mb4字符集。

2、数据库迁移，源和目标数据库的字符集不一致，此时就需要在迁移之前进行转换。

1.2 常用字符集简介

GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的，即不论中、英文字符均使用双字节来表示，为了区分中文，将其最高位都设定成1。GBK包含全部中文字符，是国家编码，通用性比UTF8差，不过UTF8占用的数据库比GBK大。支持简体中文及繁体中文。
utf8字符集：是一种UTF-8编码的Unicode字符集，每个字符占用1到3个字节。UTF-8包含全世界所有国家需要用到的字符，是国际编码，通用性强。
utf8mb4字符集：是一种UTF-8编码的Unicode字符集，每个字符占用1到4个字节。可以覆盖BMP范围内的字符和增补字符。BMP范围内的字符编码和utf8字符集中的编码是完全相同的，长度也是完全一样的，所以utf8mb4字符集可以兼容utf8字符集。
GB2312是GBK的子集，GBK是GB18030的子集。
big5支持繁体中文

二、过程

以下模拟的是将latin1字符集的数据库修改成GBK的过程。其他字符集的转换过程类似。需要注意的是要转换的目标字符集一定是源字符集的超级或者目标字符集的范围包含源字符集的范围。

2.1、导表结构

mysqldump -uroot -p --default-character-set=gbk -d databasename >createtb.sql

其中--default-character-set=gbk表示设置以什么字符集连接，-d表示只导出表结构，不导出数据。

2.2、手工修改createtb.sql中表结构定义中的字符集为新的字符集。

2.3、确保记录不再更新，导出所有记录

mysqldump -root -p --quick --no-create-info --extended-insert --default-character-set=latin1 databasename>data.sql

--quick：该选项用于转储大的表。它强制mysqldump从服务器一次一行地检索表中的行而不是所有的行，并在输出前将它缓冲到内存中。
--extended-insert：使用包括几个values列表的多行insert语法。这样使转储文件更小，重载文件时可以加速插入。
--no-create-info：不导出每个转储表的create table语句。
--default-character-set=latin1:按照原有的字符集导出所有数据。这样导出的文件中，所有中文都是可见的，不会保存成乱码。

2.4、打开data.sql，将set names latin1修改成set names bgk.

2.5、使用新的字符集创建新的数据库。

create database databasename default charset bgk;

2.6、创建表,执行createtab.sql

mysql -root -p databasename <createtb.sql

2.7、导入数据，执行data.sql

mysql -root -p databasename <data.sql

三、总结

新的字符集一定要是原字符集的超集，不然转化之后，数据会出现乱码。常见字符集转换如下：

源字符集	目标字符集	备注
GBK	UTF8
GB2312	GBK
GBK	GB18030
GB2312	UTF8
GB18030	UTF8
GB18030	UTF8MB4
GBK	UTF8MB4
GB2312	UTF8MB4
latin1	GBK
latin1	UTF8
latin1	UTF8MB4

posted @ 2020-04-13 13:34 雪竹子阅读(2078) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

昵称：雪竹子园龄：5年8个月粉丝：64 关注：3

昵称：雪竹子
园龄： 5年8个月
粉丝： 64
关注： 3

2025年3月

日

一

二

三

四

五

六

云居

当你发现自己的才华撑不起野心时，就请安静下来学习吧！

mysql不同字符集的转换过程

一、概述及字符集

1.1 需要更换字符集的场景

1.2 常用字符集简介

二、过程

2.1、导表结构

2.2、手工修改createtb.sql中表结构定义中的字符集为新的字符集。

2.3、确保记录不再更新，导出所有记录

2.4、打开data.sql，将set names latin1修改成set names bgk.

2.5、使用新的字符集创建新的数据库。

2.6、创建表,执行createtab.sql

2.7、导入数据，执行data.sql

三、总结

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

DB2

ELK

Linux

MongoDB

MySQL

Oracle

Redis

SqlServer

软件下载

我的链接

中间件

阅读排行榜

评论排行榜

推荐排行榜

最新评论