面板数据分析—PanelData1.面板数据模型简介•面板数据(paneldata)也称作时间序列与截面混合数据(pooledtimeseriesandcrosssectiondata)。面板数据是截面上个体在不同时点的重复观测数据。N=30,T=50的面板数据示意图中国各省级地区消费性支出占可支配收入比例走势中国各省级地区消费性支出占可支配收入比例走势图图面板数据分两种特征:(1)个体数少,时间长。(2)个体数多,时间短。面板数据用双下标变量表示。yit,i=1,2,…,N;t=1,2,…,Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。•yit,i=1,2,…,N;t=1,2,…,T•若固定t不变,yi.,(i=1,2,…,N)是横截面上的N个随机变量;•若固定i不变,y.t,(t=1,2,…,T)是纵剖面上的一个时间序列(个体)。•面板数据是不同个体和不同时期被观察的数据(LongitudinalorPanelData)1122iiiiyxx1122ttttyxx1122itititityxx横截面数据时间序列数据面板数据2.面板数据模型分类•用面板数据建立的模型通常有3种,即混合模型、固定效应模型和随机效应模型。•2.1混合模型(Pooledmodel)。•如果一个面板数据模型定义为,•yit=+Xit'+it,i=1,2,…,N;t=1,2,…,T•其中yit为被回归变量(标量),表示截距项,Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,it为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数和都相同。•如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,it)=0。那么无论是N,还是T,模型参数的混合最小二乘估计量(PooledOLS)都是一致估计量。•2.2固定效应模型(fixedeffectsmodel)。•固定效应模型分为3种类型,即个体固定效应模型、时点固定效应模型和个体时点双固定效应模型。下面分别介绍。•2.2.1个体固定效应模型(entityfixedeffectsmodel)•如果一个面板数据模型定义为,•yit=i+Xit'+it,i=1,2,…,N;t=1,2,…,T•其中i是随机变量,表示对于i个个体有i个不同的截距项,且其变化与Xit有关系;Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),it为误差项(标量),则称此模型为个体固定效应模型。2.2固定效应模型(fixedeffectsmodel)。解释设定个体固定效应模型的原因。假定有面板数据模型yit=0+1xit+2zi+it,i=1,2,…,N;t=1,2,…,T其中0为常数,不随时间、截面变化;每个个体回归函数的斜率1相同;zi表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以被解释为含有N个截距,即每个个体都对应一个不同截距的模型。令i=0+2zi,于是变为yit=i+1xit+it,i=1,2,…,N;t=1,2,…,T以家庭消费性支出与可支配收入关系为例,省家庭平均人口数就是这样的一个变量,即对于短期面板,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。因为zi是不随时间变化的量,所以当对个体固定效应模型中的变量进行差分时,可以剔除那些随个体变化,但不随时间变化的zi的影响。2.2.2时点固定效应模型(timefixedeffectsmodel)如果一个面板数据模型定义为,yit=t+Xit'+it,i=1,2,…,N其中t是模型截距项,随机变量,表示对于T个截面有T个不同的截距项,且其变化与Xit有关系;yit为被回归变量(标量),it为误差项(标量),满足通常假定条件。Xit为k1阶回归变量列向量(包括k个回归变量),为k1阶回归系数列向量,则称此模型为时点固定效应模型。2.2.2时点固定效应模型(timefixedeffectsmodel)设定时点固定效应模型的原因。假定有面板数据模型yit=0+1xit+2zt+it,i=1,2,…,N;t=1,2,…,T其中0为常数,不随时间、截...