引例•1899年,戈塞特进入都柏林A.吉尼斯父子酿酒公司担任酿酒化学技师,从事统计和试验工作。他发现,供酿酒的每批麦子质量相差很大,而同一批麦子仲能抽样供试验的麦子又很少,每批样本在不同的温度下做式样其结果相差很大,这决定了不同批次和温度的麦子样本是不同的,不能进行样本合并,这样一来实际上取得的麦子样本不可能是大样本,只能是小样本。小样本得出的结果和正态分布有较大差异,特别是尾部比正态分布高……•大样本和小样本有什么差异?如何用样本推断总体?•统计方法描述统计推断统计参数估计假设检验所谓统计推断,就是根据概率论所揭示的随机变量的一般规律性,利用抽样调查所获得的样本信息,对总体的某些性质或数量特征进行推断。参数估计假设检验这两类问题的基本原理是一致的,只是侧重点不同而已。参数估计问题侧重于用样本统计量估计总体的某一未知参数;假设检验问题侧重于用样本资料验证总体是否具有某种性质或数量特征。统计推断•由于统计推断是根据观察到的部分数据对总体作出推测,因此推测就不可能绝对准确,有一定的不确定性。这种不确定性的程度可以用概率的大小来表示。总体与样本总体?X这个企业员工的月平均收入是多少?niinxx1/信息由样本信息作为总体信息估计值从总体中抽取一小部分x样本统计学的重要意义就是用样本统计量的性质推断总体参数的特征。第6章统计量与抽样分布主要内容•总体和样本的统计分布•统计量•抽样分布第一节总体和样本的统计分布•一、统计推断中的总体及总体分布•总体的概念总体是根据一定的目的确定的所要研究的事物的全体,它是由客观存在的、具有某种共同性质的众多个体构成。总体中的各个单位称为个体。由引例:每批麦子每批麦子的每单位出酒量的数值编制变量的分布数列实物总体数值总体分布总体总体的含义可抽象为所感兴趣的变量及其分布。第6章统计量与抽样分布二、统计推断中的样本及其性质按照随机原则,通过观测或实验的方法所获得的总体中一部分个体的取值称为样本。每个个体的取值称为样本点或样品。样本是随机的,样本观测值是确定的。•如果样本满足同分布、独立性(iid)则为简单随机样本。•样本所包含的总体单位个数称为样本容量,一般用n表示。在实际工作中,人们通常把n≥30的样本称为大样本,而把n<30的样本称为小样本。12,,,nXXX是一堆“杂乱无章”的数据是一堆“杂乱无章”的数据设是来自总体设是来自总体的样本的样本nXXX,,,21~()XFx是对总体进行推断的依据是对总体进行推断的依据12,,,nXXX包含了有关总体的“信息”包含了有关总体的“信息”12,,,nXXX在观察前是一组独立同分布在观察前是一组独立同分布r.vr.v12,,,nXXX在观察后是一组具体的数据在观察后是一组具体的数据12,,,nxxx总体X随机变量N(,2)观察值随机变量N(,2)的值对象:某大学新生的身高2、样本的联合分布设为来自总体设为来自总体的样本的样本,,则样本的联合分布函数为则样本的联合分布函数为12,,,nXXX)(~xFX12(,,,)nFxxx设为来自总体设为来自总体的样本,则样本的联合的样本,则样本的联合概率函数概率函数为为12,,,nXXX)(~xfX12(,,,)nfxxx1()niiFx1()niifx设设为来自总体为来自总体12,,,nXXX),(~2NX的样本的样本,,则样本的联合密度为则样本的联合密度为22()2111(,,)2ninixfxxe221()211(2)niinxe第二节统计量•一、统计量与统计量的分布设(X1,X2…,Xn)是总体X的样本,则由样本(X1,X2…Xn)构成的且不含任何未知参数的函数T(X1,X2…Xn)称为统计量。2)(21XXB2122212)(3)(XXDXXC例:设(X1,X2)是总体N(,2)的一个样本,其中已知,未知参数,则下列哪个不是统计量:1、统计量定义/)(1XA推断统计研究的重点——寻找统计量及其分布——利用概率论对总体进行推断•统计量通常是随机变量,但统计量的观测值是确定的,没有随机性。比如,如果(x1,x2,…,xn)是样本(X1,X2,…,Xn)的观测值,那么T(x1,x2,…,xn)为统计量T(X1,X2…Xn)的观测值。则T(X1,X2…Xn)是...