中心极限定理-1大数定律与中心极限定理中心极限定理-2独立同分布大数定律:设随机变量X1,X2,X3,…Xn,…相互独立,且具有相同的方差和期望:E(Xk)=μ,D(Xk)=σ2(k=1,2,3,…),作前n个随机变量的算术平均则对任意小的正数ε,有nkkXnX111limXPn该定律表明,当n足够大时,独立同分布的一系列随机变量的算术平均数接近(以概率收敛于)数学期望,即平均数具有稳定性。从而提供了用样本平均数估计总体平均数的理论依据。大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。中心极限定理-3贝努利大数定律设A在n重贝努利试验中发生次,p=P(A),则对任何>0,有An.1)(limpnnPAn说明:贝努利大数定律是说,当n很大时,故可用事件发生的频率近似代替事件发生的概率。,1)(pnnPA例1设总体X服从参数为2的指数分布,为来自总体X的简单随机样本,则当n时,依概率收敛于。nXXX,,,21niinXnY121中心极限定理-4定义中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。最常用的有:独立同分布中心极限定理:“随机变量x1,x2,…独立,且服从同一分布,若存在有限的数学期望E(xi)=u和方差D(xi)=σ2,当n→∞时,随机变量的总和Σxi趋于均值为nu,方差为nσ2的正态分布。(即算术平均数1/nΣxi=xbar趋于均值为u,方差为σ2/n的正态分布)”不论总体服从何种分布,只要它的数学期望和方差存在,从中抽取容量为n的样本,则这个样本的总和或平均数是随机变量,当n充分大时,Σxi或xbar趋于正态分布。中心极限定理-5定义德莫佛-拉普拉斯中心极限定理:“如果用X表示n次独立试验中事件A发生(“成功”)的次数,P是事件A在每次试验中发生的概率,则X服从二项分布,B(n,p),当n→∞时,X趋于均值为np,方差为npq的正态分布。”正态分布和泊松分布都是二项分布的极限分布,当n足够大时,可用正态分布近似计算;当n足够大且p小时,可用泊松分布近似计算。中心极限定理是一种十分重要的现象,它是统计学中应用的许多方法的理论基础的组成部分(如:计算样本均值的置信区间)中心极限定理-6利用同样的数据画出两种不同的控制图,并仔细比较它们的差异:打开文件[CENLIMIT.MTW].分别用下面的两个路径画出个体图和子群大小为5的均值图个体图路径均值图路径应用中心极限定理-7图形输出个体数据样本平均仔细比较两个图上的控制上下线(UCL和LCL),有什么不同?应用ObservationIndividualValue1361211069176614631161100908070605040_X=68.28UCL=96.59LCL=39.97IChartofOutputSampleSampleMean28252219161310741807570656055__X=68.28UCL=80.70LCL=55.861XbarChartofOutput中心极限定理-8个体控制图和Xbar控制图的差异μUCLX3LCLX3UCLnX3LCLnX315100102030405060应用中心极限定理-9平均值分布的标准偏差叫做均值标准误差,因而其定义为:这个公式表明平均值比个体数据更稳定,稳定因子是样本数的平方根。xxnσsx==均值标准误差个体值的标准差n=平均值的样本数x均值的标准误差(StandardErroroftheMean)其中中心极限定理-10MSmeanMSn()我们经常依靠从测量系统中得到的一个数值来估计输入或输出变量的值。减小测量系统误差的简易方法就是把两个或更多的读数平均。我们的测量系统的精密度自动增加,增加因子是平均值样本数的平方根,如果我们要想使测量系统的误差减小一半,我们就需要把4次的测量值平均才可以。实际应用测量系统的改善中心极限定理-11当总体数据具备正态分布时中心极限定理理解例题模拟-1假设你面前有一个大桶,桶里面装有相当多数量的白色纸条,每张纸条上都写有数字,且假定这些数字都来自一个具有特定平均值和标准偏差的正态分布.1)从中随机抽出9张白色纸条,并把其上面的9个数字求平均,2)然后把这个平均值写在一张绿色纸条上,3)把这9张白色纸条放回原来的桶里,4)把这张绿色纸条放入另外一个桶里,如此重复上面的步骤,直到盛有绿色纸条的桶放满为止。白色纸条代表总体的数据;绿色纸条代表平均值的样本;我们用MINITAB来模拟做这个练...