统计分析方法学习总结s20XX05158陈丹妮一、统计的描述一般采用以下几种图形描述数据:直方图:表示几个变量的数据,使人们能够看出这些数目的大体分布或“形状”;盒形图:比直方图简单一些的是盒形图(boxplot,又称箱图、箱线图、盒子图);茎叶图
既展示了数据的分布形状又有原始数据
它象一片带有茎的叶子
茎为较大位数的数字,叶为较小位数的数字;散点图:描述的数据有两对连续变量;定型变量的图:定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例,如:饼图、条形图
二、汇总统计量表示位置的汇总统计量:均值(mean):样本值的算术平均值;中位数(median):中间大小的数(一半样本点小于中位数);(第一或第三)(下、上)四分位数(点)(firstquantile,thirdquantile)(分别有1/4或3/4的数目小于它们);k-百分位数(k-percentile);a分位数(acentile):k-百分位数=k%分位数:有k%的数目小于它;众数(mode):样本中出现最多的数
表示尺度的汇总统计量:极差(range):极端值之差;四分位间距(四分位极差)(interquantilerange)四分位数之差;标准差(standarddeviation)方差平方根;方差(variance)各点到均值距离平方的平均
三、相关的分布相关的分布包括:离散分布、连续分布、抽样分布:我们能够利用样本统计量中的(描述样本的)信息,比如样本均值和样本标准差中的信息,来对(描述总体的)总体参数(比如总体均值和总体标准差)进行推断(估计、检验等)
阐述大量随机变量的平均结果具有稳定性的一系列定律的总称
其中又分为独立同分布大数定律(提供了用第1页共6页样本平均数估计总体平均数的理论依据)和贝努力大数定律(提供了频率代替概率的理论依据)