年龄变量在数据分析中的应用 本文就是从人们给年龄赋予了多种含义和年龄折射出的人们的生活状态同时入手,理解年龄变量在数据分析中的应用。 分析年龄变量的三个原则: A、年龄不是简单的时间数字的堆砌; B、年龄经常不是一种直线性的关系; C、同样的年龄与各种态度的关系背后有不同的原因和理论。 下面我们从年龄所派生出的社会意义角度来理解年龄变量在数据分析中的应用。 一、生命过程与平均健康状况 最简单的理解年龄就是从生命过程角度,是一种由小到大,由盛到衰的生命过程,从统计意义上的平均人的角度,年龄代表着平均健康状况。 在问卷的变量分析过程中,如果涉及的问题与生命的数字过程有直接关系,那么就应该以一种直线式的模型来分析。这是数据分析中最容易理解和想到的分析方式,但是在实际的分析中却不是经常出现的结果。 与这种线性模型相关的问题主要包括:对健康的关注、对生命的关注、工作的取向及与这些问题相联系的社会、经济与市场行为。这些行为与态度在社会生活中是以一种近似于直线性的方式而存在的,所以用直线式的模型可以进行分析。由于这类模型容易理解,所以我们只举一个个例子来加以说明。 例1 :某次消费者调查案例 通过回归计算的不同年龄的人用于服装的花费占消费总比例统计图68101214161820202530354045505560年龄比例 这个例子说明的是,在服装这种特殊的消费品的消费过程中,不同年龄的人消费比例的变化情况,这种变动近似于线性状态。这是与人的生命过程与心态变化密切相关的。 二、发展意义上的代沟 从年龄角度看代沟,在本质上没有什么确切的模型拟合,因为从形式上理解代沟有发展式的、周期式的和断裂式的等多种形式。比如:对婚姻与性的认识就是一个渐进的过程,体现出一种 成长性(衰退性),这种叫发展式代沟;时尚的审美往往是周期性成长;特定的社会事件往往在年龄上造就特异的形态等。 本专题讨论的是发展意义上的代沟。这种代沟状态是渐进的和近乎同比发展的,因此这种意义上的年龄变量进入数据分析时,体现的是线性的特征。虽然这种类型的表现形式与生命过程的表现形式一样,但是不同的社会含义。 例2 :阅读偏好 2030405060S100.050.10.150.20.25年龄系数应用回归方法计算的不同年龄的读者喜好“ 生 活 参考 ” 程 度 统 计图 这个案例反映了年龄变动过程中,随着经验与需求的变化,人们对某些问题关注点的不同变化。这种变化与年龄有关,同时与生活经历、经验...