精品文档---下载后可任意编辑Ch1
传统观点下的多元线性回归模型回顾1
问题的提出我们认为,要关注的结果与个因素有关,
(其中是截距项,一个量纲标准化的单位指标
)例如:已婚工作妇女的工资(log wage)与工作经验(exper)、工作经验的外在性作用()、受教育程度(educ)、该妇女的年纪(age)、家庭少于 6 个孩子(kidslt6)以及家庭中孩子至少 6 岁以上的个数(kidage6)有关,并建立如下的模型:对上述模型,我们做如下说明:a
关于命题:1
要关注的结果:已婚工作妇女的工资
影响结果的因素:自身的经验、教育、年龄;和孩子的年龄与多少
结果与哪些因素有关不是绝对的,例如在中国影响工资的一个重要因素是所在行业,另外社会关系也是不可忽视的,等等
命题与你的目的和知识相关,并且命题要求表述得越清楚越好
关于模型:模型是命题的数学表达,是命题的深化、细化和抽象化
从命题到模型是一个不断提炼的过程
建立一个“好”的模型,取决于我们对命题认识的深化程度和相关知识的储备
一般而言,多元线性回归模型的基本框架是:假设与有因果关系
假如观测的数据来源是:,且存在单调连续函数,使得:,,
那么,定义多元线性回归模型:
即:,称是关于未知参数的多元线性回归模型
这里是随机误差项,称为解释变量,是确定性变量
称为因变量或被解释变量
线性模型的类型主要有:1)多项式模型:或例如,库兹涅茨倒 U 形曲线和拉弗曲线等
2)对数线性模型:(增长率之间存在因果关系,例如生产函数
)3)倒数线性模型:或(因果呈反向关系,如菲利普斯曲线)4)指数线性模型:(原因是影响增长率的因素,例如上例)5)Logit 线性模型:(因果呈慢,快,慢的变化趋势,并有饱和)如图:6)虚拟变量(Dummy Variable)模型:解释变量中有些变量变化是“不均匀”的,观测数据在不同时段或不同