第2章 时间序列的预处理 拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。 2.1 平稳性检验 2.1.1 特征统计量 平稳性是某些时间序列具有的一种统计特征。要描述清楚这个特征,我们必须借助如下统计工具。 一、概率分布 数理统计的基础知识告诉我们分布函数或密度函数能够完整地描述一个随 机变量的统计特征。同样,一个随机 变量族的统计特性也完全由它们的联 合分布函数或联合密度函数决定。 对于时间序列{tX ,t∈T } ,这样来定义它的概率分布: 任取正整数m,任取mttt,,,21∈T ,则 m 维随机向量(mtttXXX,,,21)’的联合概率分布记为),,,(mtttxxxFm21,,, 21,由这些有限维分布函数构成的全体。 {),,,(mtttxxxFm21,,, 21,∀m∈正整数,∀mttt,,,21∈T } 就称为序列{tX }的概率分布族。 概率分布族是极其重要的统计特征描述工具,因为序列的所有统计性质理论上都可以通过 概率分布推测出来,但是概率分布族的重要 性也就停留在这样的理论意义上。在实际应 用中,要得到序列的联合概率分布几乎是不 可能的,而且联合概率分布通常涉及非常复 杂的数学运算,这些原因使我们很少直接使 用联合概率分布进行时间序列分析。 二、特征统计量 一个更简单、更实用的描述时间序列统计特征的方法是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也被称为特征统计量。 尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,而且往往能代表随机 序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些统计量的统计特性,推断出随机序列的性质。 1.均值 对时间序列{tX ,t∈T } 而言,任意时刻的序列值tX 都是一个随机变量,都有它自己的概率分布,不妨记为)(xFt。只要满足条件 )(-xx dFt 就一定存在着某个常数t,使得随机变量tX 总是围绕在常数值t附近做随机波动。我们称t为序列{tX } 在 t 时刻的均值函数。 t =tEX =)(-xx dFt 当t 取遍所有的观察时刻时,就得到一个均值函数序列{t ,t∈T }。它反映的是时间序列{tX ,t∈T }每时每刻的平均水平。 2.方差 当 )(-xx dFt时,可以定义时间序列的方差...