2用样本的数字特征估计总体的数字特征(二)知识回顾1
如何根据样本频率分布直方图,分别估计总体的众数、中位数和平均数
(1)众数:最高矩形下端中点的横坐标
(2)中位数:直方图面积平分线与横轴交点的横坐标
(3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和
知识探究:标准差样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息
平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大
当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度
数据的离散程度可以用极差、方差或标准差来描述
为了表示样本数据的单位表示的波动幅度,通常要求出样本方差或者它的算术平方根
(1)方差:设在一组数据,x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是22212(),(),,()nxxxxxx2222121[()()()]nsxxxxxxn来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大
那么我们用它们的平均数,即(2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量
222121[()()()]nsxxxxxxn计算标准差的算法:S2算出每个样本数据与样本平均数的差(i=1,2,……,n);ixxS1算出样本数据的平均数x;S3算出(i=1,2,…,n);2()ixxS4算出(i=1,2,…,n)这n个数的平均数,即为样本方差s2;2()ixxS5算出方差的算术平方根,即为样本标准差s