数据库设计准则及方法论|江阴雨辰互联

2023年7月27日发(作者：)

数据库物理设计的方法论

方法一：根据数据库逻辑设计，找到相应数据库产品的实现方法。

对于同一套数据库逻辑设计，不同的数据库产品有不同的实现方法，下面的表格列出了不同数据库产品的实现技术。

逻辑架构

对称多处理器(SMP)

Sharing Nothing架构(多分区数据库)

Share Disk架构(共享磁盘)

Sharing Nothing + Share Disk

实现技术

基本所有商业数据库都支持

DB2 DPF 、TeraData、Greenplum、Netezza

DB2 pureScale、Oracle RAC

ExaData

方法二：合理设计数据库对象

合理设计对象是数据库的逻辑概念，其设计的好坏除了决定系统功能，有时还会决定系统的性能，其设计主要包括模型的设计，表类型的选择，索引的设计，分区设计，表空间的设计等。

在模型的设计上，我们通常采用第三范式来进行数据库对象的模型设计，但是有时为了性能考虑，我们通常会做一些退化，比如设计一些冗余字段或者多表合并来加快系统的查询性能。例如对于有大量数据的销售流水表，完全按照第三范式来做的话会有一个外键关联客户信息，一个外键关联产品信息。

CUSTOMERSSALESoooooSALES_IDAMOUNTTIMECUST_ID PKPROD_ID PK

但是如果系统在运行一段时间后，这三张表的数据变的非常多，那么连接查询的性能将会变得很差，我们通常的做法是再设计一张横向表，将客户信息和产品信息全都放到销售流水表里去，这样应避免了关联查询。

T_SALESooooooooooSALES_IDAMOUNTTIMECUST_IDCUST_NAMEGENDERAGEPROD_IDPROD_NAMEPROD_CATEGORY

...表通常分为很多种，除了基本表外，还有临时表、多维表、分区表、范围集群表、物化视图表等。不同的表有不同的用途，如果错误使用的话，也会对性能有比较大的影响。比如在不需要物化视图的地方使用的物化视图表，那么会对源表的增删改性能造成影响。合理的使用正确的索引是提高系统执行效率的关键因素，对索引的使用需要注意以下一些问题：

1) 注意LIKE运算符。

2) 注意NULL值。

3) 优化复合索引。

4) 注意索引的相关参数。

5) 注意索引与谓词的关系。

6) 根据查询所使用的列表建立索引。

7) 根据条件语句中的谓词的选择度创建索引。

8) 避免在建有索引的列上使用函数。

9) 在那些需要被排序的列上创建索引。

10) 合理使用include关键词创建索引。

11) 指定索引的排序属性。

数据库的页大小也是在数据库设计的时候就应该确定的，否则一旦实施就很难更改。对于执行随机行读写操作的OLTP(联机事务处理)应用程序，通常最好使用较小的页大小，这样不需要的行浪费的缓冲池空间就会较少。对于一次访问大量连续的OLAP(联机分析处理)应用程序，页大小大一些比较好，这样就能减少读取特定数目的行所需要的I/O请求数，更大的页大小也可以允许您减少索引中的级别数。总之，在满足以上条件的情况下，交易系统使用较小的页更适合，仓储系统使用较大的页更适合。

对表空间的选择，通常的数据库都包含系统管理的表空间和数据库管理的表空间两种类型。系统管理表空间由操作系统的文件系统管理器分配和管理空间，管理灵活但是性能很差。数据库管理的空间由数据库管理程序控制存储空间，表空间容器可使用文件系统或裸设备，虽然管理复杂，但是在性能上会有很大的提升。

方法三：合理设计存储

方法四：优化数据库参数，减少资源竞争

优化配置数据库的参数，包括各种缓存池的大小，内存区的配置，刷新脏页的策略，锁的策略等。虽然各个数据库都不相同，但是所有的出发点都是为了通过数据库参数，降低物理读的次数和发生资源竞争的可能性。

性能评审关注的性能指标：

1) 耗时最长的SQL的平均执行时间。

2) 数据库的平均CPU利用率。

3) CPU的执行时间、IO等待的时间和锁等待时间。

4) 平均I/O响应时间。

5) 支持峰值IOPS数和MPS数。

6) 物理读和逻辑读的百分比。

7) 有效索引读的百分比。