2定量变量——回归分析(画散点图、相关系数r、变量相关指数R、残差分析)分类变量——研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等
变量分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等
两种变量:独立性检验本节研究的是两个分类变量的独立性检验问题
在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系
性别是否对于喜欢数学课程有影响
像这类变量称为别类表示个体所属的不同值这种变量的不同分类变量吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)在不吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大
,称为频数表的样列出的两个分类变量这像列联表列联表①定义:列出的两个分类变量的称为列联表.②2×2列联表一般地,假设两个分类变量X和Y,它们的取值分别为和,其样本频数列联表(也称为2×2列联表)为下表
频数表{x1,x2}{y1,y2}一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(即2×2列联表)为:(其中n=为样本容量).y1y2合计x1aba+bx2cdc+d总计a+cb+da+b+c+da+b+c+d
,况状反映出相关数据的总体能更直观地图三维柱形图和二维条形与表格相比不患肺癌患肺癌吸烟不吸烟不患肺癌患肺癌吸烟不吸烟080007000600050004000300020001000三维柱形图二维条形图在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个柱形高度的乘积相差越大,两个分