mysql vachar

--本文在CSDN文章的基础加以补充

一. varchar存储规则:

4.0版本以下,varchar(20),指的是20字节,如果存放UTF8汉字时,只能存6个(每个汉字3字节) 
5.0版本以上,varchar(20),指的是20字符,无论存放的是数字、字母还是UTF8汉字(每个汉字3字节),都可以存放20个,最大大小是65532字节 
Mysql4中最大也不过是20个字节,但是Mysql5根据编码不同,存储大小也不同。 

二. varchar和char 的区别:

char是一种固定长度的类型,varchar则是一种可变长度的类型。

它们的区别是:char(M)类型的数据列里,每个值都占用M个字符,如果某个长度小于M,MySQL就会在右边用空格字符填补.(在检索中那些填补出来的空格字符将被去掉)。

        varchar(M)类型的数据列里,每个值只占用刚好够用的字节再加上一个用来记录其长度的字节(即总长度为L+1字节). 

 

在MySQL中用来判断是否需要进行对据列类型转换的规则

1、在一个数据表里,如果每一个数据列的长度都是固定的,那么每一个数据行的长度也将是固定的.

2、只要数据表里有一个数据列的长度的可变的,那么各数据行的长度都是可变的.

3、如果某个数据表里的数据行的长度是可变的,那么,为了节约存储空间,MySQL会把这个数据表里的固定长度类型的数据列转换为相应的可变长度类型.例外:长度小于4个字符的char数据列不会被转换为varchar类型。

三、MySQL中varchar最大长度是多少?这不是一个固定的数字。本文简要说明一下限制规则。

     不考虑大字段类型,mysql中每行记录最大字节数(即每行记录各个字段最大字节之和)不能超过65535;

 

1、限制规则

字段的限制在字段定义的时候有以下规则:

a) 存储限制

varchar 字段是将实际内容单独存储在聚簇索引之外,内容开头用1到2个字节表示实际长度(长度超过255时需要2个字节),因此最大长度不能超过65535。

 

b) 编码长度限制

字符类型若为gbk,每个字符最多占2个字节,最大长度不能超过32766;

字符类型若为utf8,每个字符最多占3个字节,最大长度不能超过21845。

若定义的时候超过上述限制,则varchar字段会被强行转为text类型,并产生warning。

c)   行长度限制

导致实际应用中varchar长度限制的是一个行定义的长度。 MySQL要求一个行的定义长度不能超过65535。若定义的表长度超过这个值,则提示

ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TEXT or BLOBs。

 

2、计算例子

举两个例说明一下实际长度的计算。

 

a)   若一个表只有一个varchar类型,如定义为

create table t4(c varchar(N)) charset=gbk;

则此处N的最大值为(65535-1-2)/2= 32766。

减1的原因是实际行存储从第二个字节开始’;

减2的原因是varchar头部的2个字节表示长度;

除2的原因是字符编码是gbk。

 

b)   若一个表定义为

create table t4(c int, c2 char(30), c3 varchar(N)) charset=utf8;

则此处N的最大值为 (65535-1-2-4-30*3)/3=21812

减1和减2与上例相同;

减4的原因是int类型的c占4个字节;

减30*3的原因是char(30)占用90个字节,编码是utf8。

 如果被varchar超过上述的b规则,被强转成text类型,则每个字段占用定义长度为11字节,当然这已经不是“varchar”了。

 

--以上为摘自网站内容,下面为个人总结:数据库版本5.0.22-community-nt,utf-8 编码,引擎为InnoDB 。

例子(一下例子再多增加一个字节都会出错):

1.

create table TEST1
(

ID1 MEDIUMINT comment '3个字节' ,
VAR1 varchar(21843) comment '21843*3+2=65531'
);

 --占满所有字节1(行记录的存储从第二个字节开始)+3(MEDIUMINT )+65531=65535

2.

create table TEST2
(

ID1 TINYINT comment '1个字节' ,
VAR1 varchar(1843) comment '1843*3+2=5531' ,
VAR2 varchar(20000) comment '2000*3+2=60002'
);

 --占满所有字节1(行记录的存储从第二个字节开始)+1(TINYINT )+5531+60002=65535

3.

create table TEST3
(

ID1 TINYINT comment '1个字节' ,
VAR1 varchar(86) comment '86*3+2=260' ,--(此时86*3>255 故应该+2)
VAR2 varchar(21757) comment '21757*3+2=65273'
);

--占满所有字节1(行记录的存储从第二个字节开始)+1(TINYINT)+260+65273=65535

 

4.

create table TEST4
(

ID1 SMALLINT comment '2个字节' ,
VAR1 varchar(85) comment '85*3+1=256' ,--(此时86*3=255 故应该+1)
VAR2 varchar(21758) comment '21758*3+2=65276' 
);

--占满所有字节1(行记录的存储从第二个字节开始)+2(SMALLINT )+256+65276=65535

 

---以上均可以合理解释但下面的却无法解释

5、

create table TEST5
(

ID1 MEDIUMINT comment '3个字节' ,


VAR1 varchar(839) comment '839*3+2=2519',
VAR2 varchar(4000) comment '4000*3+2=12002',
VAR3 varchar(4000) comment '',
VAR4 varchar(4000) comment '',
VAR5 varchar(4000) comment '',
VAR6 varchar(4000) comment '',
VAR7 varchar(1000) comment '1000*3+2=3002'
);

--按照上方的方法正好为65535.

----占满所有字节1(行记录的存储从第二个字节开始)+3(SMALLINT )+65531(后面所有)=65535

 

6、

create table TEST6
(

ID1 TINYINT comment '1个字节' ,

ID2 SMALLINTcomment '2个字节' ,


VAR1 varchar(839) comment '839*3+2=2519', 
VAR2 varchar(4000) comment '4000*3+2=12002',
VAR3 varchar(4000) comment '',
VAR4 varchar(4000) comment '',
VAR5 varchar(4000) comment '',
VAR6 varchar(4000) comment '',
VAR7 varchar(1000) comment '1000*3+2=3002' 
);

 

--将第5个测试中的ID1 MEDIUMINT comment '3个字节' ,拆分成两个,但所占字节数也为3,结果就报错。暂时无法解释该现象。

--个人感觉与字段书有关,当字段数大于一定值时,最初每行加1不够,需要加更多。

 

posted @ 2016-03-13 12:35  vicdream  阅读(597)  评论(0编辑  收藏  举报