1/13描述性统计分析本文由应用教程贡献LOGO描述性统计分析统计分析的基本概念武汉大学计算中心LOGO进行数据分析首先应:进行数据分析首先应:明确分析的目的明确分析的对象确定是否需要抽样在一些问题中,要考查整个总体往往是不可能的,因为要耗费太多的时间和资源确定需要记录的数据项目武汉大学计算中心LOGO1
总体和样本总体(总体(population)是所研究)的指标测量值的集合
的指标测量值的集合
抽样(sampling)是指从总体中抽取部分的做法
样本(sample)通过抽样得到的总体的一个子集
总体样本武汉大学计算中心LOGO抽样方法简单随机抽样:在抽样的过程中,简单随机抽样:在抽样的过程中,任何一个样本被选中的机会都相同
被选中的机会都相同
利用计算机产生的随机数(对于有限总体),可模拟简单随机抽样,如对学生的学号用随机数进行抽样对于无限总体不能进行标号,抽样过程不能用随机数,难于实施分层抽样:按数据的层次进行抽样
分层抽样:按数据的层次进行抽样
如小学生的身高,按每年级分为一个层2/13武汉大学计算中心LOGO分层抽样的优点抽取的样本在总体中分布得更均匀,抽取的样本在总体中分布得更均匀,更合理个层内单位之间差异程度相对减小,个层内单位之间差异程度相对减小,使在该层内抽取的样本对该层的代表性得到提高层内成员差异小,而层间成员差异较大时,层内成员差异小,而层间成员差异较大时,分层抽样可以提高估计的精度武汉大学计算中心LOGO2
参数和统计量对总体概括度量值和对样本概括度量值所用的方法及名称是不同的
法及名称是不同的
总体的度量值称为参数(parameters),样本的总体的度量值称为参数,度量值称为统计量(statistics)
度量值称为统计量
通常,总体参数是未知的总体参数是未知的,SAS系统给出的描述统通常总体参数是未知的系统给出的描述统计量适用于样本