136 第8 讲 用面板数据模型预测 1 .面板数据定义 时间序列数据或截面数据都是一维数据
时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据
面板数据是同时在时间和截面上取得的二维数据
面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量
所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)
面板数据示意图见图 1
面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列
图 1 N=15,T=50 的面板数据示意图 图 2 是1978~2005 年中国各省级地区消费性支出占可支配收入比率序列图
图 2 1978-2005 年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过) 137 面板数据用双下标变量表示
例如 y i t, i = 1, 2, …, N; t = 1, 2, …, T i 对应面板数据中不同个体
N 表示面板数据中含有 N 个个体
t 对应面板数据中不同时点
T 表示时间序列的最大长度
若固定 t 不变,y i
, ( i = 1, 2, …, N)是横截面上的 N 个随机变量;若固定 i 不变,y
t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)
这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据
利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度
(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量
(3)面板数