老叶观点：MySQL开发规范之我见（更新版）__老叶观点：MySQL开发规范之我见（更新版）_

PG中文社区 /

mdi-home

首页

社区新闻

中文文档

加入ACE

mdi-home

首页

mdi-chat-processing

社区新闻

mdi-book-open-variant

中文文档

mdi-account-multiple-check

加入ACE

mdi-file-multiple-outline

老叶观点：MySQL开发规范之我见（更新版）

2016 Postgres大象会官方报名通道：点此报名

作者: 叶金荣

大多数MySQL规范在网上也都能找得到相关的分享，在这里要分享的是老叶个人认为比较重要的，或者容易被忽视的，以及容易被混淆的一些地方。

1、默认使用InnoDB引擎

【老叶观点】已多次呼吁过了，InnoDB适用于几乎99%的MySQL应用场景，而且在MySQL 5.7的系统表都改成InnoDB了，还有什么理由再死守MyISAM呢。

此外，频繁读写的InnoDB表，一定要使用具有自增/顺序特征的整型作为显式主键。

当然了，也不是说MyISAM就一无是处，比如老叶之前就把MyISAM用于临时导数据数据（把数据导入MyISAM，一番处理后再入到InnoDB表）、或者一些特殊的数据统计类场景用MyISAM（大数据量下MyISAM全表顺序读取比InnoDB有明显优势）可能比较合适。前提是，你得非常清楚MyISAM引擎的优势在哪里。

【参考】：[MySQL FAQ]系列 — 为什么InnoDB表要建议用自增列做主键。

2、InnoDB表行记录物理长度不超过8KB

【老叶观点】InnoDB的data page默认是16KB，基于B+Tree的特点，一个data page中需要至少存储2条记录。因此，当实际存储长度超过8KB（尤其是TEXT/BLOB列）的大列（large column）时会引起“page-overflow存储”，类似ORACLE中的“行迁移”。

因此，如果必须使用大列（尤其是TEXT/BLOB类型）且读写频繁的话，则最好把这些列拆分到子表中，不要和主表放在一起存储。如果不太频繁，可以考虑继续保留在主表中。

当然了，如果将 innodb_page_size 选项修改成 8KB，那么行记录物理长度建议不超过4KB。

【参考】：[MySQL优化案例]系列 — 优化InnoDB表BLOB列的存储效率。

3、是否使用表分区（partition）

【老叶观点】在一些使用表分区后明显可以提升性能或者运维便利性的场景下，还是建议使用表分区。

比如老叶就在zabbix的数据库采用TokuDB引擎的前提下，又根据时间维度使用了分区。这样的好处是保证zabbix日常应用不受到影响前提下，方便管理员例行删除过去数据，只需要删除相应分区即可，不需再执行一个非常慢的DELETE而影响整体性能。

当然了，使用表分区可能不利于物理扩展，比如大数据量下想要做哈希水平拆分，这个就见仁见智了，如果你的业务场景下使用表分区更有好处，就放心大胆的用吧。该进行拆分就用拆分方案，不要继续抱着表分区方案不放。

参考：迁移Zabbix数据库到TokuDB。

4、是否使用存储过程、触发器

【老叶观点】在一些合适的场景下，用存储过程、触发器也完全没问题。

我们以前就是利用存储完成游戏业务逻辑处理，性能上不是问题，而且一旦需求有变更，只需修改存储过程，变更代价很低。我们还利用触发器维护一个频繁更新的表，对这个表的所有变更都将部分字段同步更新到另一个表中（类似物化视图的变相实现），也不存在性能问题。

有同行认为存储过程和触发器的应用可能会导致发生锁等待、死锁时排查问题上的困惑。嗯，这个是有这个可能性，不过如果真发生时，根据当时现场记录的SQL反查对应的存储过程或触发器，应该也不是难事，只不过要求DBA对线上业务环境更要了然于胸了。

总的来说，不要把MySQL的存储过程和触发器视为洪水猛兽，用好的话，没有问题的，真遇到问题了再优化也不迟。另外，MySQL因为对视图的处理也不太理想也没有物化视图，因此视图能不用就尽量少用吧。

5、选择合适的类型

【老叶观点】除了常见的建议外，还有其他几个要点：

　　5.1、用INT UNSIGNED存储IPV4地址，用INET_ATON()、INET_NTOA()进行转换，基本上没必要使用CHAR(15)来存储。

　　5.2、枚举类型可以使用ENUM，ENUM的内部存储机制是采用TINYINT或SMALLINT（并非CHAR/VARCHAR），性能一点都不差，记住千万别用CHAR/VARCHAR 来存储枚举数据。

　　5.3、还个早前一直在传播的“常识性误导”，建议用TIMESTAMP取代DATETIME。其实从5.6开始，建议优先选择DATETIME存储日期时间，因为它的可用范围比TIMESTAMP更大，物理存储上仅比TIMESTAMP多1个字节，整体性能上的损失并不大。

　　5.4、所有字段定义中，默认都加上NOT NULL约束，除非必须为NULL（但我也想不出来什么场景下必须要在数据库中存储NULL值，可以用0来表示）。在对该字段进行COUNT()统计时，统计结果更准确（值为NULL的不会被COUNT统计进去），或者执行 WHERE column IS NULL 检索时，也可以快速返回结果。

　　5.5、杜绝直接 SELECT * 读取全部字段，当表中存在 TEXT/BLOB 大列的时候就会是灾难了。可能本来不需要读取这些列，但因为偷懒写成 SELECT * 导致内存buffer pool被这些“垃圾”数据把真正需要缓冲起来的热点数据给洗出去了。

相应地，在写INSERT时，也要写上相对应的字段列表。

要求在SQL中写清楚每个字段的重要意义还在于，当业务需要表DDL发生更新后，如果不写清楚字段，可能会导致旧业务代码不可用，这个就折腾大发了。

6、关于索引

【老叶观点】除了常见的建议外，还有几个要点：

　　6.1、超过20个长度的字符串列，最好创建前缀索引而非整列索引（例如：ALTER TABLE t1 ADD INDEX(user(20))），可以有效提高索引利用率，不过它的缺点是对这个列排序时用不到前缀索引。前缀索引的长度可以基于对该字段的统计得出，一般略大于平均长度一点就可以了。

　　6.2、定期用 pt-duplicate-key-checker 工具检查并删除冗余的索引。比如 index idx1(a, b) 索引已经涵盖了 index idx2(a)，就可以删除 idx2 索引了。

　　6.3、有多字段联合索引时，WHERE中过滤条件的字段顺序无需和索引一致，但如果有排序、分组则就必须一致了。

比如有联合索引 idx1(a, b, c)，那么下面的SQL都可以完整用到索引：

SELECT ... WHERE b = ? AND c = ? AND a = ?;  --注意到，WHERE中字段顺序并没有和索引字段顺序一致 
SELECT ... WHERE b = ? AND a = ? AND c = ?; 
SELECT ... WHERE a = ? AND b IN (?, ?) AND c = ?;
SELECT ... WHERE a = ? AND b = ? ORDER BY c; 
SELECT ... WHERE a = ? AND b IN (?, ?) ORDER BY c;
SELECT ... WHERE a = ? ORDER BY b, c;
SELECT ... ORDER BY a, b, c;  -- 可利用联合索引完成排序

而下面几个SQL则只能用到部分索引，或者可利用到ICP特性：

SELECT ... WHERE b = ? AND a = ?; -- 只能用到 (a, b) 部分
SELECT ... WHERE a IN (?, ?) AND b = ?; -- EXPLAIN显示只用到 (a, b) 部分索引，同时有ICP
SELECT ... WHERE (a BETWEEN ? AND ?) AND b = ?; -- EXPLAIN显示只用到 (a, b) 部分索引，同时有ICP
SELECT ... WHERE a = ? AND b IN (?, ?); -- EXPLAIN显示只用到 (a, b) 部分索引，同时有ICP
SELECT ... WHERE a = ? AND (b BETWEEN ? AND ?) AND c = ?; -- EXPLAIN显示用到 (a, b, c) 整个索引，同时有ICP
SELECT ... WHERE a = ? AND c = ?; -- EXPLAIN显示只用到 (a) 部分索引，同时有ICP
SELECT ... WHERE a = ? AND c >= ?; -- EXPLAIN显示只用到 (a) 部分索引，同时有ICP

ICP（index condition pushdown）是MySQL 5.6的新特性，其机制会让索引的其他部分也参与过滤，减少引擎层和server层之间的数据传输和回表请求，通常情况下可大幅提升查询效率。

下面的几个SQL完全用不到该索引：

SELECT ... WHERE b = ?; 
SELECT ... WHERE b = ? AND c = ?;
SELECT ... WHERE b = ? AND c = ?;
SELECT ... ORDER BY b;
SELECT ... ORDER BY b, a;

从上面的几个例子就能看的出来，以往强调的WHERE条件字段顺序要和索引顺序一致才能使用索引的 “常识性误导” 无需严格遵守。

此外，有些时候查询优化器指定的索引或执行计划可能并不是最优的，可以手工指定最优索引，或者修改session级的 optimizer_switch 选项，关闭某些导致效果反而更差的特性（比如index merge通常是好事，但也遇到过用上index merge后反而更差的，这时候要么强制指定其中一个索引，要么可以临时关闭 index merge 特性）。

7、其他 

　　7.1、哪怕是基于索引的条件过滤，如果优化器意识到总共需要扫描的数据量超过30%时（ORACLE里貌似是20%，MySQL目前是30%，没准以后会调整），就会直接改变执行计划为全表扫描，不再使用索引。

　　7.2、多表JOIN时，要把过滤性最大（不一定是数据量最小哦，而是只加了WHERE条件后过滤性最大的那个）的表选为驱动表。此外，如果JOIN之后有排序，排序字段一定要属于驱动表，才能利用驱动表上的索引完成排序。

　　7.3、绝大多数情况下，排序的大家通常要来的更高，因此如果看到执行计划中有 Using filesort，优先创建排序索引吧。

　　7.4、利用 pt-query-digest 定期分析slow query log，并结合 Box Anemometer 构建slow query log分析及优化系统。

【参考】：[MySQL FAQ]系列 — EXPLAIN结果中哪些信息要引起关注。

备注：若无特别说明，以上规范建议适用于MySQL 5.6及之前的版本（并且主要是5.6版本，尤其是ICP特性、DATETIME变化这两个地方）。5.7及之后的版本可能会有些变化，个别规范建议需要相应调整。

特别感谢周彦伟、淘宝丁奇，对本文中的一些观点做了深入详细的探讨和完善。

2016 Postgres大象会官方报名通道：http://www.huodongxing.com/event/8352217821400

扫描报名

评论:2　　

顶: 913　

踩: 965　

请在登录后发表评论，否则无法保存。

1# __ xcvxcvsdf 回答于 2024-10-26 19:50:42+08

http://tuiguang.hntcxxw.cn/csq/ http://tuiguang.hntcxxw.cn/gdst/ http://wutai.cqtcxxw.cn/yantai/ http://ouyu.hftcbmw.cn/gxhc/ https://fenlei.tiancebbs.cn/llbx/ http://tuiguang.hntcxxw.cn/gsjqv/ https://lichuan.tiancebbs.cn/ https://gaoan.tiancebbs.cn/ http://tuiguang.hntcxxw.cn/wanning/ http://gx.lztcxxw.cn/baicheng/ http://ly.shtcxxw.cn/yangquan/ http://shenghuo.china-bbs.com/daqing/ http://huilong.sctcbmw.cn/lianyungang/ http://nalei.zjtcbmw.cn/guilin/ https://xuanen.tiancebbs.cn/ https://yejianyingjinianyuan.tiancebbs.cn/ http://nalei.zjtcbmw.cn/scls/

2# __ xiaowu 回答于 2024-04-22 09:23:14+08

给对象发的甜甜的长文:https://www.nanss.com/yulu/2002.html 高级且温柔的神仙友谊文案:https://www.nanss.com/wenan/1986.html 欠揍的生日祝福语:https://www.nanss.com/yulu/1572.html 实习结束说说文案:https://www.nanss.com/wenan/1900.html 高级难懂的文案:https://www.nanss.com/wenan/1864.html 冻人的幽默说说:https://www.nanss.com/wenan/1666.html 80后的老阿姨幽默句子:https://www.nanss.com/yulu/1841.html 打游戏怼人语录:https://www.nanss.com/wenan/1921.html 女生网络游戏名字:https://www.nanss.com/mingcheng/1813.html 好听的群名古风:https://www.nanss.com/mingcheng/1786.html 下雪的说说:https://www.nanss.com/wenan/1960.html 安全口号顺口溜:https://www.nanss.com/gongzuo/1761.html 对某人失望心寒的说说:https://www.nanss.com/wenan/1966.html 摘抄春天优美句子10字左右:https://www.nanss.com/xuexi/1581.html 从新开始的网名:https://www.nanss.com/mingcheng/1971.html 向往自由不被拘束的句子:https://www.nanss.com/yulu/1852.html 群名高端大气上档次:https://www.nanss.com/mingcheng/1543.html 梦幻西游游戏名字:https://www.nanss.com/mingcheng/1815.html 约酒的朋友圈:https://www.nanss.com/wenan/1614.html 简约网名:https://www.nanss.com/mingcheng/1835.html 致刚去世的同学短句:https://www.nanss.com/yulu/1652.html 游戏里的震撼的名言:https://www.nanss.com/shenghuo/1579.html 水滴筹感谢好心人的短句:https://www.nanss.com/yulu/1642.html 祝儿子生日短句霸气:https://www.nanss.com/wenan/1847.html 一看就是大佬的游戏名:https://www.nanss.com/mingcheng/1919.html 魔兽世界网名:https://www.nanss.com/mingcheng/1833.html 家居服文案:https://www.nanss.com/wenan/1765.html 深夜还在奋斗的句子:https://www.nanss.com/gongzuo/1878.html 儿子生日爸爸感言短语:https://www.nanss.com/yulu/1589.html 辞职跟领导道别简短感谢:https://www.nanss.com/gongzuo/1861.html