Mysql规范和使用注意点（转）

命名规范：

1表名，字段名，索引名称使用小写字母，数字采用下划线进行分割

2.表名采用模块名3个缩小字符 ‘前缀’之后顺序为表明

3.表名，字段名不超过32个字符

4.存储尸体数据的表，名称使用名词，单数

5.索引采用‘inx’开头

6.不使用保留字

7.存储实体表间多对多关系，名称建议采用‘noun_verb_noun’比如‘member_like_tag’

在sql语句中保留字一律使用大写

字符串使用单引号

比如：

SELECT id,title FROM xiaoqu WHERE id=1

SELECT id,title FROM xiaoqu WHERE areacoe=’10002’;

错误写法：

-- 错误
select ID, title from XiaoQu where id = 1
SELECT id, title FROM xiaoqu WHERE areacode = "000100010001"

关于表的设计

默认使用innodb存储引擎

字符集使用utf-8

>charset 为‘utf-8’;校验规则 collation ‘utf_gereral_ci’

效率优先，提示性能

适当的牺牲范式，加入冗余

会增加代码复杂度

关于正确的使用时间类型：

精确到秒采用timestamp

精确到时间使用date

一般不适用datetime

每个表都应该含有插入时间和更新时间这个字段

不允许用字符串去存储时间

字段尽量定义为not null

给默认值 ‘’

为什么要这样做的原因，进行查询的优化，可能这个字段会添加索引（为null情况下，会额外增加创建索引的开销）含有null的复合索引无效

类似于性别这样的固定状态的东西优先使用enum和set

enum占用一个字节，转为数值进行运算

set视节点定，最多使用8个字节

用好数值类型

原则：适用就好，越小越好

> TINYINT< SMALLINT < MEDIUMINT < INT < BIGINT
>
> 1 Byte/2 Bytes/3 Bytes/4 Bytes/8 Bytes

> FLOAT（4B）/DOUBLE（8B）
>
> DECIMAL（M,D） (M+2 B)

关于金钱这样经常参与运算的数据类型使用整形，不适用浮点数类型

> 例如金额可以用分为单位，然后采用 `INT`。如果依然要以元为单位，可以采用 `DECIMAL`。

数值类型和字符串类型进行比较

数值类型的效率更高，查询更快速，占用空间小

### 使用 INT UNSIGNED 来存储 IPv4 地址

> 使用 `INET_ATON` 将 IP 地址的字符串形式转换成数字形式；使用 `INET_NTOA` 将 IP 地址数字形式转换成字符串形式，以便查看。
>
> 当要查询某段的 IP 时，请参考以下示例：

### 不直接存储图片、音频、视频等大容量内容

> 请使用分布式文件系统来存储图片、音频、视频等内容。数据库里只存储文件的位置。

### 少用并拆分TEXT/BLOB

> TEXT类型处理性能远低于VARCHAR

为什么尽量不要使用text/blob这样的字段

强制生成硬盘临时表

浪费空间

varchar(65535)=>64K

如需使用请拆分到独立的表进行存放；

一张表中如果有很多的字段，是坏的设计

请考虑io高效，表修复，alter快/高并发

> 一个表有很多很多字段，是坏设计的味道。请再认真考虑设计是否正确。
> IO高效/表修复快/Alter快/高并发
> 以1G Size 500W Rows来评估
>
> - 顺序读取需N秒
> - 单行不超过200Byte
> - 单表不超50个INT字段，不超20个CHAR（10）字段
> - 单表字段数上限控制在20-50个

关于索引：

合理的创建索引：

索引的作用，优化查询

减慢更新

索引的添加综合评估数据的密度和数据的分布

结合核心sql优先考虑覆盖索引

### 使用数字主键

> 存储实体数据的表，其主键应该是数字类型。

### 不使用联合主键

> 存储实体数据的表，不使用联合主键。
> 存储实体表间多对多对应关系的表（仅有两个字段）允许例外。

### 不使用外键

> 所有的表不建立外键约束。

### 联合索引字段数不超过 5 个

> 一个联合索引的字段数太多，很可能是设计得不好，还很难符合命名的规范。

### 前缀索引长度不超过 8 个字符

> 对字符串类型的字段建立索引，采用前缀索引，且长度不超过 8 个字符。

### 不使用负向查询

> 负向查询是指，如果查询条件描述的是不要什么数据，其余的都要。例如 `!=`、`<>`、`NOT EXISTS`、`NOT IN` 以及 `NOT LIKE` 等就是负向查询，它们利用索引将会很辛苦。

### 一次查询的结果集不超过 100 行

> 必要时使用 `LIMIT 100`

### LIMIT m, n，其中 m 应当小于 500

> 使用 `SELECT ... LIMIT offset, row_count` 或者 `SELECT ... LIMIT row_count OFFSET offset` 时，当 offset 小于 500 时，允许使用。
>

sql
-- 允许
SELECT ... FROM property WHERE broker_id=? ORDER BY update_time LIMIT 40, 20
-- 不允许
SELECT ... FROM property WHERE areacode=? ORDER BY update_time LIMIT 4000, 20

避免使用count()函数；

> 能不使用就不使用，尽量用其他方法来解决。

-- 正确
SELECT 1 FROM propertys WHERE broker_id=? LIMIT 1

-- 错误
SELECT COUNT(*) FROM propertys WHERE broker_id=?

在代码中可以通过获取size(),或者length获得长度

### 一次 COUNT() 可能扫描的行数应当确保小于 500 行

> `COUNT()` 函数需要扫描所有的结果集之后才能得出结果。而结果集的大小需要业务知识来判断（`EXPLAIN` 方法只能来来检验某一个条件下的当前情况）。因此需要使用 `COUNT()` 查询的代码应当经过审阅。

为什么使用count(*) 除非真的想统计nullable的字段；

### 不在索引列做运算
> 不在索引列进行数学运算或函数运算
> - 无法使用索引
> - 导致全表扫描

举例：
root:xxx_db> select BrokerId from ajk_propertys where proid-100=101960636;
1 row in set (5.11 sec)

尽量不要再数据库上做运算

复杂的sql运算转移到程序端cpu

简单实用mysql

### 同数据类型的列值比较
> 原则：数字对数字，字符对字符
> 字符列与数值类型比较
> 数值列于字符列比较
> - 同时转换为双精度进行比较
> 字符列于数值列比较
> - 字符列整列转数值，不会使用索引

sql

-- 禁止

SELECT id FROM property WHERE NOW() - update_time < 3600

SELECT id FROM property WHERE update_time + 3600 > NOW()

-- 改为

SELECT id FROM property WHERE update_time > NOW() - 3600

sql

-- 禁止

SELECT id FROM property WHERE CHAR_LENGTH(title) > 20

sql

-- 假设字段 property.status 的类型为 TINYINT

-- 禁止

SELECT id FROM property WHERE status = '1'

-- 改为

SELECT id FROM property WHERE status = 1

### 禁止隐式类型转换

> 不仅在查询条件中禁止隐示类型转换，`INSERT`，`UPDATE` 也不允许隐式类型转换。

```
sql
-- 假设字段 property.status 的类型为 TINYINT
-- 禁止
INSERT INTO property (..., status) VALUES (..., '1')
UPDATE property SET status = '1' WHERE id = '43'

-- 改为
INSERT INTO property (..., status) VALUES (..., 1)
UPDATE property SET status = 1 WHERE id = 43

### 禁止使用 % 前导查询

> 尽量不使用 `LIKE` 查询，不得不用的情况下也禁止使用 `%` 前导查询。
> - 使用不了索引
> - 导致全表扫描

### 禁止SQL语句拼接
> 应用程序不能有拼接语句出现

拒绝3B

大sql（拆分）

大事物 (contrller 不适用事物，在service层开启)

大批量（使用load data）

> 大SQL VS 多个简单SQL
>
> - 传统设计思想，BUT Mysql NOT
> - 一条SQL只能在一个CPU运算
> - 1000+ QPS的高并发中，1秒大SQL可能把数据库都堵死

> 拒绝大SQL，拆解成多条简单SQL
> - 简单SQL缓存命中率更高
> - 减少锁表时间，特别是MYISAM
> - 用上多CPU

> 不同字段，将or改为union
> - 减少对不同字段进行 or 查询
> - Merge index 往往很弱智

保持事物连接尽量短小

即开即用，用完就关

减少锁资源占用

不破坏一致性的前提小，使用多个短事物代替长事物；

> 统一字符集为UTF8
> 禁用子查询
> - 大部分情况优化较差
> - 特别是Where中使用IN id的子查询
> - 一般可用JOIN改写

### 约定类规范（二）
> 永远不在程序端显示加锁
> - 永远不在程序端对数据库显式加锁
> - 外部锁对数据库不可控
> - 高并发是灾难
> - 极难调试和排查
> 可采用事务操作

```
举例：
Select GET_LOCK(‘str’)
```
### 约定类规范（三）
> 请不要使用存储过程
> 请不要使用trigger

posted on 2016-10-21 11:17 xu_xiang 阅读(346) 评论(0) 编辑收藏举报

刷新页面返回顶部

xu_xiang

Mysql规范和使用注意点（转）

导航

公告