第三讲统计、统计案例一、随机抽样1、简单随机抽样(1).设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2).最常用的简单随机抽样的方法有两种:抽签法和随机数表法.2、系统抽样假设要从容量为N的总体中抽取容量为n的样本.(1).先将总体的N个个体编号.(2).确定分段间隔k,对编号进行分段,当是整数时,取k=,当不是整数时,随机从总体中剔除余数,再取k=.(3).在第1段用简单随机抽样确定第一个个体编号l(l≤k).(4).按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.这种抽样方法是一种系统抽样.3、分层抽样1.定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.2.应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.二、用样本估计总体1、作频率分布直方图的步骤(1).求极差(即一组数据中最大值与最小值的差).(2).决定组距与组数.(3).将数据分组.(4).列频率分布表.(5).画频率分布直方图.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2、频率分布折线图和总体密度曲线(1).频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2).总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3、茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的1旁边生长出来的数.用茎叶图表示数据的两个优点一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.4、标准差和方差(1).标准差是样本数据到平均数的一种平均距离.(2).标准差:s=.(3).方差:s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).平均数、方差的公式推广①若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.②数据x1,x2,…,xn的方差为s2.(Ⅰ)数据x1+a,x2+a,…,xn+a的方差也为s2;(Ⅱ)数据ax1,ax2,…,axn的方差为a2s2.基础自测1.(2013·湖南高考)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A.抽签法B.随机数法C.系统抽样法D.分层抽样法【解析】由于是调查男、女学生在学习兴趣与业余爱好方面是否存在差异,因此用分层抽样方法.【答案】D2.[2014·广东卷]为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案:C[解析]由题意得,分段间隔是=25.3.[2014·天津卷]某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.答案:60[解析]由分层抽样方法可得,从一年级本科生中抽取的学生人数为300×=60.4.(2013·辽宁高考)某班的全体学生参加英语测试,成绩的频率分布直方图如图9-2-3,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()图9-2-3A.45B.50C.55D.60【解析】根据频率分布直方图的特...