25/2/2409:121选修1-2(一)25/2/2409:122回顾:必修3(第二章统计)知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析25/2/2409:1231、两个变量的关系不相关相关关系函数关系线性相关非线性相关问题1:现实生活中两个变量间的关系有哪些?相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。25/2/2409:124思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系.相关关系是一种非确定性关系.函数关系是一种理想的关系模型.相关关系在现实生活中大量存在,是更一般的情况.25/2/2409:125问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢?2、最小二乘估计最小二乘估计下的线性回归方程:ˆˆˆybxa121()()ˆ()niiiniixXyYbXXˆˆaYbX25/2/2409:126对一作直线运动的质点的运动过程作了8次观测,得到下表,试估计当x=9s时质点的位置y的值。时刻x/s12345678位置观测值y/cm5.547.5210.0211.7315.6916.1216.9821.06例如:25/2/2409:12705101520250246810系列1解:(1)作出散点图从散点图看出,样本呈直线趋势,时间x与位置观测值y有较好的线性关系,可以用线性回归方程刻画它们之间的关系.25/2/2409:128ixiyixi2xiyi115.5415.54227.52415.043310.02930.064411.731646.925515.692578.456616.123696.727716.9849118.98821.0664168.5∑36104.66204560.1(2)列表08.1350.4nyynxxii其中:25/2/2409:129(3)求线性回归方程:y=3.5361+2.1214x25/2/2409:12103、回归分析的基本步骤:画散点图求回归方程列表25/2/2409:1211数学《必修3》——统计1.画出散点图.2.求出b,a的值.3.求回归直线方程.4.用线性回归方程解决应用问题.25/2/2409:12124、线性回归模型yabx其中a+bx是确定性函数,是随机误差注:随机误差产生的主要原因:(1)所用的确定性函数不恰当;(2)忽略了某些因素的影响;(3)存在观测误差。思考:在时刻x=9s时,质点运动位置一定是22.6287cm吗?25/2/2409:1213对于线性回归模型应注意以下两个问题:I模型的合理性;II在模型合理的情况下,如何估计a,b.yabx25/2/2409:1214例1.下表给出我国从1949至1999年人口数据资料,试根据表中数据估计我国2004年的人口数。年份4954596469747984899499人口数/百万5426036727058079099751035110711771246年份05101520253035404550人口数/百万5426036727058079099751035110711771246分析:先画图25/2/2409:121502004006008001000120014000102030405060系列1解:作出散点图从散点图看出,这些点在一条直线附近,可以用线性回归方程刻画它们之间的关系.25/2/2409:1216ixiyixi2xiyi10542002560325301531067210067204157052255208074006259096257309759008351035122594011071600104511772025115012462500∑列表25/2/2409:1217根据公式得:b=14.453a=527.591线性回归方程为:y=527.591+14.453x当x=55时,y=1322.506(百万)25/2/2409:1218例题2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:零件数(x)个102030405060708090100加工时间y626875818995102108115122(1)y与x是否具有线性相关?(2)若y与x具有线性相关关系,求回归直线方程(3)预测加工200个零件需花费多少时间?25/2/2409:1219050100150050100150系列1分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断x与y是否具有线性相关才可以求解后面的问题。作散点图如下:不难看出x,y成线性相关。25/2/2409:1220解(1)列出下表:i12345678910xi102030405060708090100yi626875818995102108115122xiyi6201360225032404450570071408640103501220025/2/2409:1221问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?