[二轮备考讲义]专题五概率与统计第二讲统计与统计案例1.本部分主要考查随机抽样、样本估计总体、线性回归分析、独立性检验的简单应用,一般是选择题、填空题,试题难度中等或稍易.若以解答题出现,往往与概率交汇考查.2.在复习统计问题时,要紧紧抓住这些图表和方法,把图表的含义弄清楚,这样剩下的问题就是有关的计算和对统计思想的理解,在弄清楚统计问题的基础上,要与概率、期望、方差结合掌握.基础记忆试做真题基础要记牢,真题须做熟基础知识不“背死”,就不能“用活”!1.统计(1)抽样方法:简单随机抽样、系统抽样、分层抽样(2)利用样本频率分布估计总体分布①频率分布表和频率分布直方图.②总体密度曲线.③茎叶图.(3)用样本的数字特征估计总体的数字特征①众数、中位数.②平均值x=x1+x2+…+xnn.③方差与标准差方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].标准差s=1n[x1-x2+x2-x2+…+xn-x2].2.线性回归方程(1)对n个样本数据(x1,y1),(x2,y2),…,(xn,yn),其线性回归方程为y^=b^x+a^,其中b^=∑ni=1xiyi-nxy∑ni=1xi2-nx2,a^=y-b^x,x,y分别是{xi},{yi}的平均数.(2)相关系数r>0,表明两个变量正相关;r<0,表明两个变量负相关;|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量之间几乎不存在线性相关关系;|r|>0.75时,认为两变量有很强的线性相关关系.3.独立性检验假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=nad-bc2a+bc+da+cb+d,高考真题要回访,做好真题底气足1.(2014·重庆高考)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案:A解析:方法一:由题意可得70n-70=35001500,解得n=100,故选A.方法二:由题意,抽样比为703500=150,总体容量为3500+1500=5000,故n=5000×150=100.2.(2014·陕西高考)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002B.x+100,s2+1002C.x,s2D.x+100,s2答案:D解析:利用样本的均值、方差公式求解.x1+x2+…+x1010=x,yi=xi+100,所以y1,y2,…,y10的均值为x+100,方差不变,故选D.3.(2014·天津高考)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.答案:60解析:根据分层抽样的定义,按照每层所占的比例求解.根据题意,应从一年级本科生中抽取的学生人数为44+5+5+6×300=60.4.(2014·广东高考)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.热点盘点细研深究必须回访的热点名题[试题调研][例1](1)(2014·湖南高考)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2