❖ 介绍本文介绍 Pi v o t al Greenplum Da t a base数据库(以下简称:Gr ee n p lu m数据库,或 GPDB)得最佳实践
最佳实践就是指能持续产生比其她方法更好结果得方法或者技术,它来自于实战经验,并被证实了遵循这些方法可以获得可靠得预期结果
本最佳实践旨在通过利用所有可能得知识与技术为正确使用 G PD B 提供有效参考
本文不就是在教您如何使用 Greenpl u m 数据库得功能,而就是帮助您在设计、实现与使用 Gr e en p lum 数据库时了解需要遵循哪些最佳实践
关于如何使用与实现具体得G reenp l u m 数据库特性,请参考 上得 G r eenplu m数据库帮助文档以及 上得 Sandbo x 与实践指南
本文目得不就是要涵盖整个产品或者产品特性,而就是概述 GPDB 实践中最重要得因素
本文不涉及依赖于 G P DB 具体特性得边缘用例,后者需要精通数据库特性与您得环境,包括SQ L访问、查询执行、并发、负载与其她因素
通过掌握这些最佳实践知识,会增加 G P D B集群在维护、支持、性能与可扩展性等方面得成功率
第一章 最佳实践概述本部分概述了G ree n pl u m 数据库最佳实践所涉及得概念与要点
数据模型GP D B 就是一个基于大规模并行处理(MPP)与无共享架构得分析型数据库
这种数据库得数据模式与高度法律规范化得事务性 SMP 数据库显著不同
通过使用非法律规范化数据库模式,例如具有大事实表与小维度表得星型或者雪花模式,GPDB 在处理 MP P分析型业务时表现优异
跨表关联(JOIN)时字段使用相同得数据类型
详见数据库模式设计(后续章节)堆存储与追加优化存储(Ap pen d—Optimi z ed,下称 A O)若表与分区表需要进行迭代式得批处理或者频繁执行单个 U PD ATE