mysql字符集(character set)

搞了一上午终于算是搞定了数据库的字符集问题了。数据库的字符集从我刚开始接触IT时候就是个问题,但当时没有搞明白,而且对计算机很多原理,上网搜集资料都能力不足。今天又碰到了这个问题,好好考虑了下,然后还在边搜集资料边思考问题,这是一大改进。

通常网上的数据,编译器里的数据或者输出的数据都是utf8形式的。而数据库可以用show create database dbname查看,可以看到有很多地方涉及字符集。

 

show create database dbname 看到的字符集是根据my.cnf中的default-character-set得到的;当然也可以在创建数据库的时候指定字符集。而对于已经创建好的数据库也可以通过alter改变其字符集。方法:

修改数据库的字符集

    mysql>usemydb

    mysql>ALTER DATABASE mydb CHARACTER SET utf-8(utf8) COLLATE utf8_general_ci

数据库创建时指定字符集:create database dbname default character set utf8 collate utf8_general_ci

其中最后一段是数据库校对规则。


下面附上关于数据库的一些操作。

一、设置编码

LINUX  修改vi/etc/my.cnf

WINDOWS my.ini

  在[client]下添加

     default-character-set=utf8 

  在[mysqld]下添加

     default-character-set=utf8

   保存,重启MySQL即可;


二、创建对象时设置字符集

1 创建数据库指定数据库的字符集

    mysql>CREATEDATABASE IF NOT EXISTS mydb DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci

2 创建表时指定字符集    

    CREATETABLE table_name (id int unsigned) DEFAULT CHARACTER SET utf8 COLLATEutf8_general_ci;

3 创建字段时指定字符集

CREATETABLE table_name2 (id int,name char(10) CHARACTER SET utf8 COLLATE utf8_general_ci);


三、查看编码

1、查看 MySQL 数据库服务器和数据库字符集

  show variables like'%char%';

2、查看 MySQL 数据库服务器和数据库核对排序方式(校对规则)

    SHOWVARIABLES LIKE 'COLLATION';

3、查看当前安装的 MySQL 所支持的字符集。

  show charset;

4、查看当前数据库编码:

   SHOW CREATE DATABASE db_name;

5、查看表编码:

  SHOW CREATE TABLE tbl_name;

6、查看字段编码:

   SHOW FULL COLUMNS FROM tbl_name;


四、修改字符集

1.修改数据库的字符集

    mysql>usemydb

    mysql>ALTERDATABASE mydb CHARACTER SET utf-8(utf8) COLLATE utf8_general_ci

2.修改表的字符集

   把表默认的字符集和所有字符列(CHAR,VARCHAR,TEXT)改为新的字符集:

      ALTER TABLE tbl_name CONVERT TO CHARACTER SET character_name[COLLATE ...]

     如:ALTER TABLE logtest CONVERT TO CHARACTER SET utf8 COLLATE utf8_general_ci;

    只是修改表的默认字符集:

     ALTER TABLE tbl_name DEFAULT CHARACTER SET character_name[COLLATE...];

     如:ALTER TABLE logtest DEFAULT CHARACTERSET utf8 COLLATE utf8_general_ci; 

3.修改字段的字符集:

  ALTER TABLE tbl_nameCHANGE c_name c_name CHARACTER SET character_name [COLLATE ...];

   如:ALTER TABLE logtest CHANGE title titleVARCHAR(100) CHARACTER SET utf8 COLLATE utf8_general_ci;


五、用mysql命令修改编码

 setcharacter_set_client=utf8; //客户端字符集

 setcharacter_set_connection=utf8; //链接字符集

 setcharacter_set_database=utf8; //数据库字符集

 setcharacter_set_results=utf8;  //结果字符集

 setcharacter_set_server=utf8;  //服务器字符集

 set character_set_system=utf8;  //系统字符集

 setcollation_connection=utf8; //链接校对

 setcollation_database=utf8;  //数据库校对

 setcollation_server=utf8;    //服务器校对

  setnames 字符集;同时修改character_set_client/character_set_connection/character_set_results字符集.


六、MySQL中的字符集转换过程

 1. MySQL Server收到请求时将请求数据从character_set_client转换为character_set_connection;

 2. 进行内部操作前将请求数据从character_set_connection转换为内部操作字符集,其确定方法如下:

    使用每个数据字段的CHARACTER SET设定值;

   若上述值不存在,则使用对应数据表的DEFAULT CHARACTER SET设定值(MySQL扩展,非SQL标准);

    若上述值不存在,则使用对应数据库的DEFAULTCHARACTER SET设定值;

   若上述值不存在,则使用character_set_server设定值。

 3. 将操作结果从内部操作字符集转换为character_set_results。


七、MySQL默认字符集

    MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。 但是,传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配

置,那么,默认的配置从何而来呢?

    (1)编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;

    (2)安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;

    (3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;

    (4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server;

    (5)当选定了一个数据库时,character_set_database被设定为这个数据库默认的字符集;

    (6)在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;

    (7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

 

八、其他注意事项

    MySQL的字符集支持(Character SetSupport)有字符集(Character set)和排序方式(Collation)两个方面。对于字符集的支持细化到四个层次: 服务器(server),数据库(database)

,数据表(table)和连接(connection)。

    my.cnf中的default_character_set设置只影响mysql命令连接服务器时的连接字符集,不会对使用libmysqlclient库的应用程序产生任何作用!

    对字段进行的SQL函数操作通常都是以内部操作字符集进行的,不受连接字符集设置的影响。

    如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

 

如果要批量修改表和字段的字符集可用下面命令生成一个sql文件,然后再执行

SELECT
CONCAT('alter table ',table_name,' CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;')
FROM
INFORMATION_SCHEMA.tables
WHERE
TABLE_SCHEMA='database_name'  into outfile '/mysql/1.sql';

 

 

此外还有一篇修改数据库字符集的文章也不错:

如何将character_set_database latin1 改为 gbk

问题:通过sql语言向数据库中添加中文的数据的时候,查询是显示的是乱码。

原因:当初安装数据库是默认的编码是latin1编码(Latin1是ISO- 8859-1的别名,有些环境下写作Latin- 1)

解决: 我是讲latin1编码改为gbk   ,,,如过你不是,我相信也差不多按照这写步骤。

①首先进入到mysql暗转目录下,记事本打开my.ini文件将

default-character- set=latin1    改为     default-character- set=gbk

default-character- set=latin1     改为    default-character- set=gbk    注意有两行

②但是修改了这两行还不够,因为你的数据库编码依然还是latin1,你可以doc进入mysql命令下,运行show variables like  ' character% '; 显示的内容是:

+--------------------------+-----------------------------------+
| Variable_name            | Value                             |
+--------------------------+-----------------------------------+
| character_set_client     | gbk                               |
| character_set_connection | gbk                               |
| character_set_database   | latin1                            |         //此处显示数据库依然是latin1编码
| character_set_filesystem | binary                            |
| character_set_results    | gbk                               |
| character_set_server     | gbk                               |
| character_set_system     | utf8                              |             // 此处是系统默认的
| character_sets_dir       | E:\phpStudy\MySQL\share\charsets\ |
+--------------------------+-----------------------------------+


③修改默认编码有两种方法 

1》在创建数据库时指定字符集create database yourDB CHARACTER SET gbk;

 如果是MYSQL数据库编码不正确: 可以在MYSQL执行如下命令: ALTER DATABASE `test` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci
 修改MYSQL表的编码:ALTER TABLE `category` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci
 修改字段的编码:ALTER TABLE `test` CHANGE `dd`  VARCHAR(  45 ) CHARACTER SET gbk COLLATE gbk_chinese_ci NOT NULL

2》我是用的这种方法,因为我电脑上配置了php环境所以可以用这种方法:即运行一个php文件通过那个修改数据编码。你通过网页浏览该文件时填写一些数据就能修改了     文件下载地址http: // dl.vmall.com/c08ge26aop                   文件直接解压到放php文件目录通过浏览器打开就行

通过上面这些步骤差不多就能显示出下面的内容了

在运行命令show variables like  ' character% ';   


+--------------------------+-----------------------------------+
| Variable_name            | Value                             |
+--------------------------+-----------------------------------+
| character_set_client     | gbk                               |
| character_set_connection | gbk                               |
| character_set_database   | gbk                               |
| character_set_filesystem | binary                            |
| character_set_results    | gbk                               |
| character_set_server     | gbk                               |
| character_set_system     | utf8                              |
| character_sets_dir       | E:\phpStudy\MySQL\share\charsets\ |
+--------------------------+-----------------------------------+

④万一还是不行。。。以为我也是一路试着来的,所以有些步骤可能我认为没起作用但却可能起了作用的有

1》mysql>  set names gbk;

Query OK,  0 rows affected ( 0.00 sec)
它相当于下面的三句指令:
SET character_set_client = gbk;
SET character_set_results = gbk;
SET character_set_connection = gbk;
因此,这个方法也可以解决所有字符编码设置为gbk,而控制台显示中文乱码的问题。

⑤当然你也可以试试SET character_set_client = gbk;  即set这种命令来修改各个变量,但当时我不知道这个,也没试过。如果你上面的方法不行可以试试这个。

————————————————
版权声明:本文为CSDN博主「尽拣寒枝不肯栖」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_27231343/article/details/52334831

posted @ 2021-06-22 09:41  dreamw  阅读(1517)  评论(0编辑  收藏  举报