数据分析方法汇总 一,描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度
1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法
2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验
常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法
二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验
1)U验 使用条件:当样本含量 n较大时,样本值符合正态分布 2)T检验 使用条件:当样本含量 n较小时,样本值符合正态分布 A 单样本 t检验:推断该样本来自的总体均数μ 与已知的某一总体均数 μ 0 (常为理论值或标准值)有无差别; B 配对样本 t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C 两独立样本 t检验:无法找到在各方面极为相似的两样本作配对比较时使用
2、非参数检验非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验
适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的
A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等
三、信度分析 检査测量的可信度,例如调查问卷的真实性
分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度