第十章短面板一、面板数据的特点paneldataorlongitudinaldataindividualnT面板数据或平行数据()指的是在一段时间内跟踪同一组个体()的数据。它既有横截面的维度(个个体),又有时间维度(个时间)。TnshortpanelTnlongpanel通常的面板数据较小而较大,这种面板数据称为短面板()。反之,如果较大而较小,则称为长面板()。dynamicpanelstaticpanel在面板模型中,如果解释变量包含被解释变量的滞后值,则称为动态面板()。反之,则称为静态面板()balancedpanelunbalancedpanel本章介绍静态的短面板,下一章介绍长面板与动态面板。如果在面板数据中,每个时期在样本中的个体完全一样,则称为平衡面板数据()反之,则称为非平衡面板数据()1heterogeneity面板数据的主要优点如下:可以解决遗漏变量问题。遗漏变量偏差是一个普遍存在的问题。虽然可以用工具变量法解决,但有效的工具变量常常很难找。遗漏变量常常是由于不可观测的个体差异或异质性()造成的如果这种个体差异不随时间而改变,则面板数据提供了解决遗漏变量问题的又一利器。2提供更多个体动态行为的信息。由于面板数据同时有横截面与时间两个维度,有时它可以解决单独的截面数据或时间序列数据所不能解决的问题。比如,考虑如何区分规模效应与技术进步对企业生产效率的影响。对于截面数据来说,由于没有时间维度,故无法观测到技术进步。然而,对于单个企业的时间序列数据来说,我们无法区分其生产效率的提高究竟有多少是由于规模扩大,有多少是由于技术进步。又比如,对于失业问题,截面数据能告诉我们在某个时点上哪些人失业,而时间序列数据能告诉我们某个人就业与失业的历史,但这两种数据均无法告诉我们,是否总是同一批人在失业(意味着低流转率),还是失业的人群总在变动(意味着高流转率)如果有面板数据,就可能解决上述问题。3样本容量较大。由于同时有截面维度与时间维度通常面板数据的样本容量更大,从而可以提高估计的精确度当然,面板数据通常不满足独立同分布的假定,因为同一个体在不同期的扰动项一般存在自相关二、估计面板数据模型的策略pooledregression估计面板数据模型的一个极端策略是将其看成是截面数据而进行混合回归(),即要求样本中每个个体都拥有完全相同的回归方程。另一极端策略则是,为每个个体估计一个单独的回归方程。前者忽略了个体间不可观测或被遗漏的异质性(进入了扰动项),而该异质性可能与解释变量相关从而导致估计不一致。后者则忽略了个体间的共性。ititiiitindividual-specificeffectsmodelyxzui=1nt=1,T因此,在实践中常采用折中的估计策略,即假定个体的回归方程拥有相同的斜率,但可以有不同的截距项,以此来捕捉异质性。这种模型称为个体效应模型(),即=+++(,,;,)iitiitiitizzztxucompositeerrortermu其中,为不随时间而变的个体特征(即=,)比如性别;而可以随个体及时间而变。扰动项由(+)两部分构成,称为复合扰动项(),其中,不可观测的随机变量是代表个体异质性的截距项。ititiu为随个体与时间而改变的扰动项。假设为独立同分布的,且与不相关。iiuFixedEffectsModelFEu如果与某个解释变量相关,则进一步称之为固定效应模型(,简记为)。固定效应这个名词容易引起误解。因为即使在固定效应模型中,个体效应也是随机的(尽管其取值不随时间而变),而非固定的常数。iiuOLSu当与某个解释变量相关,即固定效应模型下,是不一致的,解决的方法是将模型转换,消去后获得一致估计量。三、混合回归iitiuxzRandomEffectsModelREFERE如果与所有解释变量(,)均不相关,则称之为随机效应模型(,简记为)。从经济理论的角度来看,随机效应模型比较少见,因为一般来说,不可观测的异质性通常会对解释变量产生影响。须通过检验来确定是还是ititiiitititiitityxzui=1nt=1,Tyxzx如果所有个体都拥有完全一样的回归方程,则方程=+++(,,;,)可写为:=+++其中,不包括常数项。OLSpooledregression这样,就可以把所有数据放在一起,像对待横截面数据那样进行回归,...