千万级的大表!MySQL这样优化更好
对于一个千万级的大表,现在可能更多的是亿级数据量,很多人第一反应是各种切分,可结果总是事半功倍,或许正是我们优化顺序的不正确。下面我们来谈谈怎样的优化顺序可以让效果更好。
MySQL数据库一般都是按照下面的步骤去演化,成本也是由低到高:
1/ SQL优化
1. 避免使用select *
-
返回结果过多,降低查询的速度;
-
过多的返回结果,增加数据传输量;
2. 可确定返回记录数的,尽量增加limit n;
3. 尽量少用like查询,会导致索引失效;
2/ 软件优化
1. 选择合理的引擎
-
MyISAM索引顺序访问方法,支持全文索引,非事务安全,不支持外键,会加表级锁;
-
InnoDB事务型存储引擎,加行锁,支持回滚,崩溃恢复,ACID事务控制;
2. 正确使用索引
-
结合适的列表建立索引;
-
索引值应该不相同,唯一值时效果最好,大量重复效果很差;
-
不能滥用索引,索引占用空间;
-
使用短索引,存的索引多,消耗IO更小,能提高查找速度;
3. 字段尽量设置成NOT NULL
-
NULL占空间,对于Java和OC强类型的,容易千万APP闪退;
4. MySQL分区表
3/ 硬件优化
1. Linux内核用内存开缓存存储数据;
2. 增加应用缓存,例如Memcached、Redis读写性能非常高;
3. 用SSD代替机械硬盘
-
日志和数据分开存储,日志顺序读写 - 机械硬盘,数据随机读写 - SSD;
4. SSD+SATA混合存储,对热数据缓存,例如:FlashCache;
4/ 架构优化
1. 读写分离
-
可以把数据库读和写拆开,对应主从服务器,主服务器写操作、从服务器是读操作;
-
读是一些机器,写是一些机器,二进制文件的主从复制,延迟解决方案;
-
主服务器写操作的同时,同步到从服务器,保持数据完整性——主从复制;
2. 垂直拆分
-
根据模块的耦合度,将一个大的系统分为多个小的系统,也就是分布式系统;
-
字段分成多个表;
3. 水平拆分
-
分表:数据分成多个表,拆分后的每张表的表头相同;
-
分库:类型方案有Cobar(阿里开源,无更新)、MyCat(基于Cobar);
总结
尽我们所能去优化SQL吧!它成本最低,却又是一项费时费力的活,需要在技术与业务都熟悉的情况下,用心去优化才能做到最优,优化后效果也是立竿见影的!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通