大数据统计分析方法在新冠疫情期间经济领域中的应用摘要:统计工作在社会管理、科学研究、日常生活中起着非常重要的作用,特别是在我国融入世界经济、成为第二大世界经济体以后,经济领域的统计工作越发重要,每次我国的经济领域的指标发布都成为世界经济的风向标,对世界经济的走向起到很大的指导作用,准确的统计工作在经济发展中起到不可或缺的作用。随着社会的发展,统计工作已经覆盖了人类社会的各个领域。统计的方法也随着科学的发展进步不断发展,为人们从数据中获得准确的结论、找到规律提供了有效的手段。经济全球化时代,全球经济是一个共同体,没有任何一个经济体可以独善其身,可谓是一荣俱荣一损俱损。运用大数据统计分析方法深刻剖析新冠疫情对我国经济领域的影响,可便于我们更加清晰地认识到此次新冠疫情对我国整体所带来的冲击。。关键词:统计方法应用新冠疫情一、常用的数据分析方法:1、描述统计描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。(1)集中趋势分析集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?(2)离中趋势分析离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。例如,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分差或百分点来比较。(3)相关分析相关分析探讨数据之间是否具有统计学上的关联性。这种关系既包括两个数据之间的单一相关关系——如年龄与个人领域空间之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系;既包括A大B就大(小),A小B就小(大)的直线相关关系,也可以是复杂相关关系(A=Y-B*X);既可以是A、B变量同时增大这种正相关关系,也可以是A变量增大时B变量减小这种负相关,还包括两变量共同变化的紧密程度——即相关系数。2、假设检验(1)参数检验参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。1)U验:使用条件:当样本含量n较大时,样本值符合正态分布2)T检验:使用条件:当样本含量n较小时,样本值符合正态分布(2)非参数检验非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。3、信度分析信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。4、列联表分析列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。5、相关分析研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。(1)、单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量;(2)、复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关;(3)、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。6、方差分析使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。7、回归分析(1)、一元线性回归分析:只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。(2)、多元线性回归分析使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。(3)、Logistic回归分析线性回归模型要求因变量是...