学案学案44用样本估计总体与用样本估计总体与变量间的相关关系变量间的相关关系返回目录1
用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况
比例大小返回目录(2)频率分布折线图连接频率分布直方图中各小长方形,就得到频率分布折线图
(3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息
(4)茎叶图2
用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数上端的中点众数:在样本数据中,频率分布最大值所对应的样本数据;中位数:样本数据中,累积频率为0
5时所对应的样本数据值(累积频率:样本数据小于某一数值的频率叫做该数值点的累积频率);平均数:样本数据的算术平均数,即x=
(2)标准差的计算公式:s=
从散点图上看,点散布在就称这种相关关系为正相关,如果点散布在返回目录)xx(xn1n21+…++从左下角到右上角的区域内从左上角到右下角的区域内就称这种相关关系为负相关
[]2n2221x)-(xx)-(xx)-(xn1+…++4
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有,这条直线叫做回归直线,回归直线方程常记作
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),用最小二乘法,求回归直线系数a,b的公式为b==,a=
其中,x=,y=
返回目录y-bxxn1in1i∑=yn1in1i∑=线性相关关系x)-(xy)-x)(y-(x2in1iiin1i∑∑==nx-xyxn-yx22in1iiin1i∑∑==bx+a=yˆ通过求Q=的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做