1 面板数据模型1.面板数据定义。时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。面板数据用双下标变量表示。例如yi t, i = 1, 2, ⋯, N; t = 1, 2, ⋯, TN 表示面板数据中含有N 个个体。T 表示时间序列的最大长度。若固定 t 不变,yi ., ( i = 1, 2, ⋯, N)是横截面上的N 个随机变量;若固定i 不变, y. t, (t = 1, 2, ⋯, T)是纵剖面上的 一个时间序列(个体)。图 1 N=7,T=50 的面板数据示意图例如 1990-2000 年 30 个省份的农业总产值数据。固定在某一年份上,它是由 30 个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。对于面板数据yi t, i = 1, 2, ⋯ , N; t = 1, 2, ⋯ , T 来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看, 每一期都有观测值, 则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。注意 :EViwes 3.1、4.1、5.0 既允许用平衡面板数据也允许用非平衡面板数据估计模型。例 1(file:panel02 ):1996-2002 年中国东北、华北、华东15 个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1 和表 2。数据是 7 年的,每一年都有15 个数据,共 105 组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15 个个体。人均消费和收入的面板数据从纵剖面观察分别见图2 和图 3。从横截面观察分别见图4 和图 5。横截面数据散2 点图的表现与观测值顺序有关。图 4 和图 5 中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。表 1 1999-2002 年中国东北、华北、华东15 个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996 1997 199...