1 面板数据模型1.面板数据定义
时间序列数据或截面数据都是一维数据
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据
面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)
面板数据是同时在时间和截面空间上取得的二维数据
面板数据示意图见图1
面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列
面板数据用双下标变量表示
例如yi t, i = 1, 2, ⋯, N; t = 1, 2, ⋯, TN 表示面板数据中含有N 个个体
T 表示时间序列的最大长度
若固定 t 不变,yi
, ( i = 1, 2, ⋯, N)是横截面上的N 个随机变量;若固定i 不变, y
t, (t = 1, 2, ⋯, T)是纵剖面上的 一个时间序列(个体)
图 1 N=7,T=50 的面板数据示意图例如 1990-2000 年 30 个省份的农业总产值数据
固定在某一年份上,它是由 30 个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列
面板数据由30 个个体组成
共有330 个观测值
对于面板数据yi t, i = 1, 2, ⋯ , N; t = 1, 2, ⋯ , T 来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看, 每一期都有观测值, 则称此面板数据为平衡面板数据(balanced panel data)
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)
注意 :EViwe