虹桥飞机场出租车数据分析报告虹桥飞机场出租车数据分析报告 从数据我们可以得到五种数据: label yy1=逗留时间=等待时间+服务时间; f10 label yy2=排队长度; fi 中非零数据个数 label yy3=服务时间; 做差 fif(i1) label yy4=服务流量; 单位时间(一小时)内 fi 中非零数据个数 label yy5=顾客流量; 一天内 fi 中非零数据个数 下面对排队长度数据进行分析。服务流量、顾客流量数据分析类似。 1.识别性分析:识别原始数据 对原始数据进行原始识别处理,先画柱状图形(直方图)和饼状图形如下 从图形可以猜想,其图形是普松分布。 普松分布的一阶矩估量为 myyy=myyminyy; lambda1=myyy ; 3.28571 普松分布的二阶矩估量为 lambda2=ssyy**2; 6.37372 普松分布的区间估量为(见茆诗松和周纪芗,概率论与数理统计,中国统计出版社,2024,p334337) lambdaxx=mn*myyy; array kk[1000] kk1kk1000; do k=1 to 1000; kk[k]=1poisson(lambdaxx,k)probchi(2*lambdaxx,2*(k+1)); if k>2 and kk[k] 1.稳健性分析:比较各种估量的差别 普松分布的一阶矩估量和普松分布的区间估量两种估量比较接近, 但普松分布的二阶矩估量与前两者差别很大。用三种估量的平均值作为参数 lambda 的估量应是比较稳健的 lambdaqz=(lambda1+lambda2+lambdazwqj)/3;4.32159 即使不考虑二阶矩估量,用其他两种估量的平均值作为参数 lambd 的估量也应是比较稳健的 lambdaqz=(lambda1+lambdazwqj)/2; 3.29552 3. 协调性分析:比较估量分布与经验离散频率分布 3.2:诊断估量分布与经验离散频率分布图形的协调性 以上述参数作为普松分布的估量与经验离散频率分布函数的比较图形为 从图形看出拟合不好. 即使不考虑二阶矩估量,用其他两种估量的平均值作为参数 lambd 的估量,以此参数作为普松分布的估量与经验离散频率分布函数的比较图形为 从图形看出拟合也不好. 尽管它看起来比前一种好一点,即图形的接近程度高一些, 但两种分布的差别还是较大。 3.2:估量分布与经验离散频率分布理论的协调性 用皮尔逊的 Kf 统计量进行拟合检验两种情况都没有通过. N=238, l=1, Kf= 728.110 >272.836 (显著性水平 0.05) N=238, l=1, Kf= 325.637 >272.836 (显著性水平 0.05) 其中 n 为数据个数,l 为估量参数个数。而 Kf 为经验离散频率分布函数和拟合分布的差的平方的加权和, 近视为 KF 统计量,...