Mysql规范和使用注意点(转)

命名规范:

 

1表名,字段名,索引名称使用小写字母,数字采用下划线进行分割

2.表名采用模块名3个缩小字符 ‘前缀’之后顺序为表明

3.表名,字段名不超过32个字符

4.存储尸体数据的表,名称使用名词,单数

5.索引 采用‘inx’开头

6.不使用保留字

7.存储实体表间多对多关系,名称建议采用‘noun_verb_noun’比如‘member_like_tag’

在sql语句中保留字一律使用大写

字符串使用单引号

比如:

SELECT id,title FROM xiaoqu WHERE id=1

SELECT  id,title FROM xiaoqu  WHERE areacoe=’10002’;

错误写法:

-- 错误
select ID, title from XiaoQu where id = 1
SELECT id, title FROM xiaoqu WHERE areacode = "000100010001"

关于表的设计

默认使用innodb存储引擎

字符集使用utf-8

>charset 为‘utf-8’;校验规则 collation ‘utf_gereral_ci’

效率优先,提示性能

适当的牺牲范式,加入冗余

会增加代码复杂度

 

关于正确的使用时间类型:

精确到秒 采用timestamp

精确到时间 使用date

一般不适用datetime

每个表都应该含有插入时间和更新时间 这个字段

不允许用字符串去存储时间

字段尽量定义为not null

给默认值 ‘’

为什么要这样做的原因,进行查询的优化,可能这个字段会添加索引(为null情况下,会额外增加创建索引的开销) 含有null的复合索引无效

类似于性别这样的固定状态的东西 优先使用enum和set

enum占用一个字节,转为数值进行运算

set视节点定,最多使用8个字节

用好数值类型

原则:适用就好,越小越好

> TINYINT< SMALLINT < MEDIUMINT < INT < BIGINT
>
> 1 Byte/2 Bytes/3 Bytes/4 Bytes/8 Bytes

> FLOAT(4B)/DOUBLE(8B)
>
> DECIMAL(M,D) (M+2 B)

 

关于金钱这样经常参与运算的数据类型使用整形,不适用浮点数类型

> 例如金额可以用分为单位,然后采用 `INT`。如果依然要以元为单位,可以采用 `DECIMAL`。

数值类型和字符串类型进行比较

数值类型的效率更高,查询更快速,占用空间小

### 使用 INT UNSIGNED 来存储 IPv4 地址

> 使用 `INET_ATON` 将 IP 地址的字符串形式转换成数字形式;使用 `INET_NTOA` 将 IP 地址数字形式转换成字符串形式,以便查看。
>
> 当要查询某段的 IP 时,请参考以下示例:

### 不直接存储图片、音频、视频等大容量内容

> 请使用分布式文件系统来存储图片、音频、视频等内容。数据库里只存储文件的位置。

### 少用并拆分TEXT/BLOB

> TEXT类型处理性能远低于VARCHAR

为什么尽量不要使用text/blob这样的字段

强制生成硬盘临时表

浪费空间

varchar(65535)=>64K

如需使用请拆分到独立的表进行存放;

一张表中如果有很多的字段,是坏的设计

请考虑io高效,表修复,alter快/高并发

> 一个表有很多很多字段,是坏设计的味道。请再认真考虑设计是否正确。
> IO高效/表修复快/Alter快/高并发
> 以1G Size 500W Rows来评估
>
> - 顺序读取需N秒
> - 单行不超过200Byte
> - 单表不超50个INT字段,不超20个CHAR(10)字段
> - 单表字段数上限控制在20-50个

关于索引:

合理的创建索引:

索引的作用,优化查询

减慢更新

索引的添加综合评估数据的密度和数据的分布

结合核心sql优先考虑覆盖索引

### 使用数字主键

> 存储实体数据的表,其主键应该是数字类型。

### 不使用联合主键

> 存储实体数据的表,不使用联合主键。
> 存储实体表间多对多对应关系的表(仅有两个字段)允许例外。

### 不使用外键

> 所有的表不建立外键约束。

### 联合索引字段数不超过 5 个

> 一个联合索引的字段数太多,很可能是设计得不好,还很难符合命名的规范。

### 前缀索引长度不超过 8 个字符

> 对字符串类型的字段建立索引,采用前缀索引,且长度不超过 8 个字符。

 

### 不使用负向查询

> 负向查询是指,如果查询条件描述的是不要什么数据,其余的都要。例如 `!=`、`<>`、`NOT EXISTS`、`NOT IN` 以及 `NOT LIKE` 等就是负向查询,它们利用索引将会很辛苦。

### 一次查询的结果集不超过 100 行

> 必要时使用 `LIMIT 100`

### LIMIT m, n,其中 m 应当小于 500

> 使用 `SELECT ... LIMIT offset, row_count` 或者 `SELECT ... LIMIT row_count OFFSET offset` 时,当 offset 小于 500 时,允许使用。
>

sql
-- 允许
SELECT ... FROM property WHERE broker_id=? ORDER BY update_time LIMIT 40, 20
-- 不允许
SELECT ... FROM property WHERE areacode=? ORDER BY update_time LIMIT 4000, 20

 

避免使用count()函数;

> 能不使用就不使用,尽量用其他方法来解决。

-- 正确
SELECT 1 FROM propertys WHERE broker_id=? LIMIT 1

-- 错误
SELECT COUNT(*) FROM propertys WHERE broker_id=?

在代码中可以通过获取size(),或者length获得长度

### 一次 COUNT() 可能扫描的行数应当确保小于 500 行

> `COUNT()` 函数需要扫描所有的结果集之后才能得出结果。而结果集的大小需要业务知识来判断(`EXPLAIN` 方法只能来来检验某一个条件下的当前情况)。因此需要使用 `COUNT()` 查询的代码应当经过审阅。

 

为什么使用count(*) 除非真的想统计nullable的字段;

### 不在索引列做运算
> 不在索引列进行数学运算或函数运算
> - 无法使用索引
> - 导致全表扫描

举例:
root:xxx_db> select BrokerId from ajk_propertys where proid-100=101960636;
1 row in set (5.11 sec)

尽量不要再数据库上做运算

复杂的sql运算转移到程序端cpu

简单实用mysql

### 同数据类型的列值比较
> 原则:数字对数字,字符对字符
> 字符列与数值类型比较
> 数值列于字符列比较
> - 同时转换为双精度进行比较
> 字符列于数值列比较
> - 字符列整列转数值,不会使用索引

 

sql

-- 禁止
 
SELECT id FROM property WHERE NOW() - update_time < 3600
 
SELECT id FROM property WHERE update_time + 3600 > NOW()

-- 改为
 
SELECT id FROM property WHERE update_time > NOW() - 3600

sql
 
  -- 禁止
 
SELECT id FROM property WHERE CHAR_LENGTH(title) > 20

sql
 
-- 假设字段 property.status 的类型为 TINYINT
 
-- 禁止
 
SELECT id FROM property WHERE status = '1'

-- 改为
 
SELECT id FROM property WHERE status = 1

 

### 禁止隐式类型转换

> 不仅在查询条件中禁止隐示类型转换,`INSERT`,`UPDATE` 也不允许隐式类型转换。

```
sql
-- 假设字段 property.status 的类型为 TINYINT
-- 禁止
INSERT INTO property (..., status) VALUES (..., '1')
UPDATE property SET status = '1' WHERE id = '43'

-- 改为
INSERT INTO property (..., status) VALUES (..., 1)
UPDATE property SET status = 1 WHERE id = 43

 

### 禁止使用 % 前导查询

> 尽量不使用 `LIKE` 查询,不得不用的情况下也禁止使用 `%` 前导查询。
> - 使用不了索引
> - 导致全表扫描

### 禁止SQL语句拼接
> 应用程序不能有拼接语句出现

 

拒绝3B

大sql(拆分)

大事物 (contrller 不适用事物,在service层开启)

大批量(使用load data)

> 大SQL VS 多个简单SQL
>
> - 传统设计思想,BUT Mysql NOT
> - 一条SQL只能在一个CPU运算
> - 1000+ QPS的高并发中,1秒大SQL可能把数据库都堵死

> 拒绝大SQL,拆解成多条简单SQL
> - 简单SQL缓存命中率更高
> - 减少锁表时间,特别是MYISAM
> - 用上多CPU

> 不同字段,将or改为union
> - 减少对不同字段进行 or 查询
> - Merge index 往往很弱智

 

保持事物连接尽量短小

即开即用,用完就关

减少锁资源占用

不破坏一致性的前提小,使用多个短事物代替长事物;

 

> 统一字符集为UTF8
> 禁用子查询
> - 大部分情况优化较差
> - 特别是Where中使用IN id的子查询
> - 一般可用JOIN改写

 

### 约定类规范(二)
> 永远不在程序端显示加锁
> - 永远不在程序端对数据库显式加锁
> - 外部锁对数据库不可控
> - 高并发是灾难
> - 极难调试和排查
> 可采用事务操作

 

```
举例:
Select GET_LOCK(‘str’)
```
### 约定类规范(三)
> 请不要使用存储过程
> 请不要使用trigger

posted on 2016-10-21 11:17  xu_xiang  阅读(346)  评论(0编辑  收藏  举报

导航