面板数据模型 一、 面板数据的概念 面板数据是时间序列数据和截面数据相结合的二维数据,为方面起见,暂且将之统称为 TC 数据(即时间截面二维数据的意思),以我国 31 个省份 1991-1999年的 GDP 数据为例,则每一个年度称为一个截面,每个省份称为一个个体,每一个年度的 31 个省份的 GDP 数据(31 个)就是截面数据,每一个省份的 9 年的 GDP 数据(9 个)就是时间序列数据,即 GDP 这个变量在时间维度有 9 个取值,在截面维度有 31 个取值,这些数据合在一起就是 TC 数据,共 31*9=279个。如果每个截面包含相同数量的个体,则称之为平衡 TC 数据,否则为非平衡TC 数据。 面板数据的主要优点有: 1. 有利于降低多重共线性程度。增加数据纬度的同时也增加了样本容量,样本容量增加可以增加变量之间的差异,降低变量间的相关程度,从而降低共线性程度。 2. 可以进行模型效应分析,更准确地理解统计结果的实际含义。 二、 面板数据模型的种类 面板数据模型分为 Pooled Data 模型和 Panel Data 模型二类,Pooled Data 模型适用于研究时期较多个体较少的 TC 数据,须为每个个体命名,研究目的侧重于个体差异或时期趋势;Panel Data 模型适用于研究个体较多、时期较少的 TC数据,不须为每个个体命名,研究目的侧重于由时期差异或个体推断总体。 另外,Pooled Data 模型允许各时期的个体不相同,Panel Data 模型要求各时期的个体相同。例如: pooled data t=1:A B C D F t=2:A B D E panel data t=1:A B C D E t=2:A B C D E 三、 模型的基本形式 1. Pooled Data 模型 itititititxy,TtNi,,1;,,1…………① 2. Panel Data 模型 ititititxfy,TtNi,,1;,,1…………① 其中, itxf 可以是非线性的。 比较分析:由于研究目的不同,所以前者允许系数可变,后者假定系数不变。 四、 模型形式的分类 根据模型是否存在个体效应(即不同的个体是否有不同的模型),可分为效应模型和无效应模型两类,其中,Pooled Data 模型的效应模型又分为变系数模型和变截距模型两种;Panel Data 模型的效应模型只有变截距模型一 种。所以,Pooled Data 模型有3 种,Panel Data 模型只有2 种。 1. 效应模型 (1 ) 变系数模型 如果对不同的i(t ),it 和it 都不相同,则称为个体(时期)效应...