蓝桉云顶

Good Luck To You!

如何遵循MySQL数据库设计规范?

mysql数据库设计规范是一系列最佳实践和指南,旨在帮助开发者创建高效、可扩展且易于维护的数据库。这些规范包括数据类型选择、索引优化、规范化原则、命名约定以及安全性考虑等。遵循这些规范有助于提升数据库性能,减少数据冗余,并增强数据的完整性和一致性。

MySQL数据库设计规范

一、库名和表结构

1 库名

强制:库的名称必须控制在32个字符以内,相关模块的表名与表名之间尽量提现join的关系,如user表和user_login表。

强制:库的名称格式:业务系统名称_子系统名,同一模块使用的表名尽量使用统一前缀。

强制:创建数据库时必须显式指定字符集,并且字符集只能是utf8或者utf8mb4,创建数据库SQL举例:create database db1 default character set utf8;。

2 表结构

强制:表和列的名称必须控制在32个字符以内,表名只能使用字母、数字和下划线,一律小写。

强制:表名要求模块名强相关,如师资系统采用”sz”作为前缀,渠道系统采用”qd”作为前缀等。

强制:创建表时必须显式指定字符集为utf8或utf8mb4。

强制:创建表时必须显式指定表存储引擎类型,如无特殊需求,一律为InnoDB,当需要使用除InnoDB/MyISAM/Memory以外的存储引擎时,必须通过DBA审核才能在生产环境中使用,因为Innodb表支持事务、行锁、宕机恢复、MVCC等关系型数据库重要特性,为业界使用最多的MySQL存储引擎,而这是其他大多数存储引擎不具备的,因此首推InnoDB。

强制:建表必须有comment。

建议:表中所有字段必须都是NOT NULL属性,业务可以根据需要定义DEFAULT值,因为使用NULL值会存在每一行都会占用额外存储空间、数据迁移容易出错、聚合函数计算结果偏差等问题。

建议:核心表(如用户表,金钱相关的表)必须有行数据的创建时间字段create_time和最后更新时间字段update_time,便于查问题。

建议:对表里的blob、text等大字段,垂直拆分到其他表里,仅在需要读这些对象的时候才去select。

建议:反范式设计:把经常需要join查询的字段,在其他表里冗余一份,如user_name属性在user_account,user_login_log等表里冗余一份,减少join查询。

强制:中间表用于保留中间结果集,名称必须以tmp_开头,备份表用于备份或抓取源表快照,名称必须以bak_开头,中间表和备份表定期清理。

强制:对于超过100W行的大表进行alter table,必须经过DBA审核,并在业务低峰期执行,因为alter table会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。

二、列数据类型优化

1 自增列

建议:表中的自增列(auto_increment属性),推荐使用bigint类型,因为无符号int存储范围为-2147483648~2147483647(大约21亿左右),溢出后会导致报错。

2 选择性少的状态字段

建议:业务中选择性很少的状态status、类型type等字段推荐使用tinytint或者smallint类型节省存储空间。

3 IP地址字段

建议:业务中IP地址字段推荐使用int类型,不推荐用char(15),因为int只占4字节,可以用如下函数相互转换,而char(15)占用至少15字节,一旦表数据行数到了1亿,那么要多用1.1G存储空间,SQL:select inet_aton('192.168.2.12'); select inet_ntoa(3232236044); PHP: ip2long('192.168.2.12'); long2ip(3530427185);

4 ENUM和SET类型

建议:不推荐使用enum,set,因为它们浪费空间,且枚举值写死了,变更不方便,推荐使用tinyint或smallint。

5 BLOB和TEXT类型

建议:不推荐使用blob,text等类型,它们都比较浪费硬盘和内存空间,在加载表数据时,会读取大字段到内存里从而浪费内存空间,影响系统性能,建议和PM、RD沟通,是否真的需要这么大字段,Innodb中当一行记录超过8098字节时,会将该记录中选取最长的一个字段将其768字节放在原始page里,该字段余下内容放在overflow-page里,不幸的是在compact行格式下,原始page和overflow-page都会加载。

6 金钱字段存储

建议:存储金钱的字段,建议用int,程序端乘以100和除以100进行存取,因为int占用4字节,而double占用8字节,空间浪费。

7 文本数据存储

建议:文本数据尽量用varchar存储,因为varchar是变长存储,比char更省空间,MySQL server层规定一行所有文本最多存65535字节,因此在utf8字符集下最多存21844个字符,超过会自动转换为mediumtext字段,而text在utf8字符集下最多存2^24-1=16777216个字符,mediumtext最多存2^24/3-1=16777216个字符,longtext最多存2^32-1=4294967295个字符,一般建议用varchar类型,字符数不要超过2700。

8 时间类型选择

建议:时间类型尽量选取timestamp,因为datetime占用8字节,timestamp仅占用4字节,但是范围为1970-01-01 00:00:01到2038-01-19-03:14:07,更为高阶的方法,选用int来存储时间,使用SQL函数unix_timestamp()和from_unixtime()来进行转换。

三、索引设计规范

1 索引数量

强制:单张表中索引数量不超过5个,限制每张表上的索引数量,建议单张表索引不超过5个索引;索引可以提高效率也可以降低效率,索引可以提高查询效率,但也会降低插入和更新的效率,尤其过多的索引会让删除变得很慢,优化器在选择如何优化查询时,会根据统一信息,对每一个可以用到的索引来进行评估,以生成出一个执行计划,所以如果发现确实索引不够用时,可以新建组合索引。

2 唯一索引命名

强制:非唯一索引必须按照“idx_<构成索引的字段名>”进行命名;在age上添加索引idx_age

强制:唯一索引必须按照“uidx_<构成索引的字段名>”进行命名;uidx_cardid

建议:组合索引建议包含所有字段名,过长的字段名可以采用缩写形式;idx_age_name

3 临时表和备份表

强制:临时表用于保留中间结果集,名称必须以tmp_开头,备份表用于备份或抓取源表快照,名称必须以bak_开头,中间表和备份表定期清理。

4 Alter Table操作

强制:对于超过100W行的大表进行alter table,必须经过DBA审核,并在业务低峰期执行,因为alter table会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。

四、分库分表及分区表

1 分库分表

强制:一般分库名称命名格式是库通配名_编号,编号从0开始递增,比如wenda_001;以时间进行分库的名称格式是“库通配名_时间”。

2 分区表

建议:谨慎使用MySQL分区表,业务生命周期内,评估单表数据量是否在1000万以内,超出此范围需考虑分库分表可扩展性;分区表在物理上表现为多个文件,在逻辑上表现为一个表,谨慎选择分区键,跨分区查询效率可能更低,建议采用物理分表的方式管理大数据。

3 冷热数据分离

建议:尽量做到冷热数据分离,减小表的宽度,MySQL限制每个表最多存储4096列,并且每一行数据的大小不能超过65535字节 减少磁盘IO保证热数据的内存缓存命中率(表越宽,把表装载进内存缓冲池时所占用的内存也就越大,也会消耗更多的IO)更有效的利用缓存,避免读入无用的冷数据 经常一起使用的列放到一个表中(避免更多的关联操作)。

五、DAO层设计建议

1 程序设计注意点

建议:程序设计时注意防止SQL注入,PreparedStatement是其中一种解决方案,但不建议多处硬编码SQL语句和占位符,推荐使用MyBatis或类似持久层框架管理SQL。

建议:DAL层方法返回值做拆箱处理,即:return box.getXXX();而不是 return box; 这样可以避免NPE问题。

建议:集合返回类型使用List<T>而不是Set<T>,因为框架通常无法判断两个对象的比较规则是什么,如果传入的对象不具备比较规则的话,会引起框架误判为两个不同的对象。

六、FAQs

1 什么时候使用分区表?

:分区表适用于超大数据量的情况下,可以通过分区提高查询和管理效率,但是需要注意,分区键的选择和跨分区查询的性能问题。

6.2 为什么推荐使用InnoDB存储引擎?

:InnoDB支持事务、行级锁、崩溃恢复和多版本并发控制(MVCC),适合高并发读写场景,是MySQL默认的存储引擎,具有更好的性能和可靠性。

以上内容就是解答有关“mysql数据库设计规范_数据库设计规范”的详细内容了,我相信这篇文章可以为您解决一些疑惑,有任何问题欢迎留言反馈,谢谢阅读。

  •  雪山之巅远望
     发布于 2024-02-02 21:33:21  回复该评论
  • 深度解析Web安全的技术指南内容丰富实用,对于每一个网络爱好者和专业人士来说,都是一篇不容错过的必读文章。
  •  真爱
     发布于 2024-02-29 21:39:55  回复该评论
  • 深度解析Web安全的技术指南,详尽阐述了网络环境中的威胁与防护策略,对于每一个网络安全从业者来说都是一份宝贵的参考资料。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接