我国股民过度自信与交易的正态性进行了检验,发现无论是偏度还是峰度我们都能在小于0
001的水平上拒绝序列服从正态分布的假设
为了解决这一问题,我们采用bootstrap的方法
我们知道,要想对统计量的精确性进行衡量我们首先需要确定其样本分布
如果事先知道总体分布,或者先验的对总体分布状况进行了假定,我们就可以从总体中随机抽取n个样本,计算出统计量的值
bootstrap的方法与之不同之处在于,他是利用观测到的样本分布作为真实总体分布的替代
同时,bootstrap产生出一个样本分布的bootstrap分布,利用bootstrap分布,我们可以估计出统计值的标准差以及置信区间等指标
举例来说,假设我们的样本有n个观测值,利用这n个观测值我们可以计算出某个估计量,但是由于我们不清楚样本的分布情况,我们就无法利用t统计量或者其他统计量对的置信区间进行界定
但是,我们可以利用放回抽样的方法随机的从这n个观测值中抽取m个,然后利用这m个值计算出一个估计量
重复上述操作k次,我们可以得到一个序列,利用该序列我们可以估计出的bootstrap分布,然后利用该分布计算出的置信区间等指标
随着计算机处理数据能力的提高,近些年来,bootstrap的方法得到广泛的应用
尤其当我们遇到样本观测值存在相关性或者说样本存在偏斜分布(skeweddistribution)问题的时候,bootstrap方法为我们提供了一个很好的估计置信区间的方法
kothari和warner(1997)认为,该方法“为一些旨在降低设定错误(misspecification)的替代检验提供了一个很有前景的框架
”lyon,barber和tsai(1999)验证了这种方法的接受率和拒绝率(acceptanceandrejectionrate),发现对于随机样本来讲,该方法非常有效
在本文中,我们利用统计软件stata提供的