横截面数据、时间序列数据、面板数据横截面数据:(时间固定)横截面数据是在同一时间,不同统计单位相同统计指标组成的数据列。横截面数据是按照统计单位排列的。因此,横截面数据不要求统计对象及其范围相同,但要求统计的时间相同。也就是说必须是同一时间截面上的数据。如:时间序列数据: (横坐标为 t,纵坐标为 y) 在不同时间点上收集到的数据,这类数据反映某一事物、现象等随时间的变化状态或程度。如:面板数据: (横坐标为 t,斜坐标为 y,纵坐标为 z) 是截面数据与时间序列数据综合起来的一种数据类型。其有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把 panel data 译作“面板数据”。举例:如:城市名:北京、上海、重庆、天津的GDP 分别为 10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如: 2000、2001 、2002 、2003 、2004 各年的北京市GDP 分别为 8、 9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。如: 2000、2001 、2002 、2003 、2004 各年中国所有直辖市的GDP分别为:北京市分别为8、9、10、 11、12;上海市分别为9、10、11、12、13;天津市分别为5、6、7、8、9;重庆市分别为7、8、9、10、11(单位亿元)。这就是面板数据。关于面板数据的统计分析在写论文时经常碰见一些即是时间序列又是截面的数据,比如分析1999-2010的公司盈余管理影响因素,而影响盈余管理的因素有 6个,那么会形成如下图的数据公司 1 公司 2 公司 100 因素 1 ⋯⋯因素 6 盈余管理程度因素 1 ⋯⋯因素 6 盈余管理程度因素 1 ⋯⋯因素 6 盈余管理程度1999 2000 ⋯⋯2010 如上图所示的数据即为面板数据。 显然面板数据是三维的,而时间序列数据和截面数据都是二维的,把面板数据当成时间序列数据或者截面数据来处理都是不合适的。处理面板数据的软件较多,一般使用Eviews6.0、Stata等。个人推荐使用Stata,因为 Stata比较适合处理面板数据,且个性化强。以下以Stata11.0为例来讲解怎么样处理面板数据。由于面板数据的存储结构与我们通常使用的存储结构不太一样,所在统计分析前,最好在excel中整理一下数据,形成如下图所示的数据年份公司名称因素 1 因素 2 ⋯⋯因素 6 盈余管理程度1...