了解六西格玛中的统计分布摘要: 许多顾问会做假设的测试模板来决定进行何种类型的测试。无论如何要考虑所取得的数据的类型。假如仅有总结性的数据,如何应用它来得到结论?原始数据最能反映事情的状况,但是它可能不直观,那就仍然需要进行测试 ...为演绎数据,顾问需要了解分布。本文讨论了如何了解统计分布的不同类型、不同分布的应用以与给出一个已知分布的假设。-许多顾问会做假设的测试模板来决定进行何种类型的测试。无论如何要考虑所取得的数据的类型。假如仅有总结性的数据,如何应用它来得到结论?原始数据最能反映事情的状况,但是它可能不直观,那就仍然需要进行测试。为了不仅是看到数据,还要演绎它,顾问需要了解分布。本文讨论了以下几点:l 了解统计分布的不同类型。l 了解不同分布的应用。l 给出一个已知分布的假设。l六西格玛绿带的培训集中在图形、中心和宽度。图形的概念受限于连续数据的正态分布。本文会通过分布所表现出来的(包括总体和样本)而在图形概念上进行延展。回到基本原理建立在一个假设模型基础上,用概率,述估量必定事件发生的机会。对于数据统计学说,观察数据习惯上确定一个描述这个数据的模型。该模型与数据的分布有关。统计是从样本推断到总体,而概率是从总体到样本。推断性统计是基于样本数据描述总体参数的一门科学。推断性统计可以应用于:l 确定过程能力(确定百万分缺陷数)。l 利用分布来估量给出已知参数的变量事件的发生概率。推断性统计基于正态分布。Figure 1: Normal Curve and Probability Areas图 1:正态曲线和概率面积 正态曲线分布可以扩展获得其它分布。结合收集到的数据类型在对过程策划和分布离差或图形理解的基础上指定恰当的分布。它可以帮助我们得到最好的分析结果。分布的类型分布的分类与数据分类一样-连续和离散:l 连续概率分布是随机变量相关的概率,在一个区间可以取无限多个数值即为随机变量。l 离散概率分布列出一个实验所有可能的结果和它们各自发生的概率。分布描述概率质量函数(pmf)-对于离散变量来说,pmf 是随机变量取值 x 的概率。概率密度函数(pdf)-对连续变量来说,pdf 是取值为 x 的随机变量在两点之间总体分布概率。在通常意义上来说,人们在一个连续整体中无法给出一个特定 x 的概率,而是一些特定(很小)的围。补充一下,可以想象成 x+Dx, Dx 很小。Pdf 的符号是 f(x)。对于离散分布:f(x) = P(X = x)自从用于评估离散质...