第4章样本描述与数据准备VIP免费

下载本文档

阅读 95
下载 2
格式 doc
大小 348 KB
约14页
2024-11-11 发布于河南
收藏
评论
点赞(0)
海报
举报

1/14页

2/14页

3/14页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/14

文本预览下载提示常见问题

第4章样本描述与数据准备样本数据采集到以后，不能立即用于数据分析，因为样本可能存在错误数据、缺失数据或者异常数据，或者采集的数据不符合要求，不具有代表性，这些情况会直接影响到分析结果的准确性和准确性。所以，进行数据分析以前，需要首先了解一下样本数据的基本特征，并对缺失值和异常值等进行适当的处理。第一节样本的描述一、基本数学知识样本数据采集到以后，常用一些统计量描述原始数据的集中程度和离散状况，对数据的总体特征进行归纳。（1）描述中心趋势的统计量算术平均数：样本数据的总和除以数据个数得到算术平均数，算术平均数是描述样本数据中心趋势最常用的统计量，因为具有计算简便、稳定的优点。中位数：将样本数据（假设有个数）按照升序或者降序排列，如果为奇数，则数列中间的数为中位数；如果为偶数，则中位数为居中两数的均值。中位数不如算术平均数稳定，即在同一总体中取相同大小的不同样本时，中位数的变化比算术平均数大。但是中位数不受极值的影响，因而在经济统计中应用较多。众数：样本数据中出现频数最大的那个数称为众数。众数容易理解，但是不容易确定，与中位数一样，不受极值的影响。截尾平均数：将样本数据进行排序后，按照一定的比率去掉两端的某些数，对剩下的数据求平均值，得到截尾平均数。常用的截尾平均数有5%截尾平均数，即两端去掉5%的数据以后剩余的数求平均数。截尾平均数与算术平均数相比，较少受极值的影响。几何平均数：个非负数的几何平均数可以表示为：几何平均数应用于任何两个相邻数之比为常数或者接近常数的数据资料。调和平均数：个数的调和平均数可以表示为：其它中心趋向的度量还有某种四分数、十分数和百分数的平均值。其中，分位数是随机变量的一种数字特征，假设连续型随机变量的密度函数是，给定常数，若满足：则称为的分位数。（2）描述离散趋势的统计量仅仅利用描述中心趋势的统计量，不能够反映整个数据集合的分布状况，具有不同分布的数据可能具有相同的算术平均数、中位数或者众数等。因此，还需要统计量来反映数据与描述中心趋向统计量之间的离散状况。这样的统计量主要包括以下几种：极差：极差是样本数据中最大值与最小值的差值，极值舍弃了最大值与最小值之间的数据信息，仅仅依靠端点值来确定，因而稳定性差。平均差：样本数据中各数据与均值之间差值的平均数称为平均差。平均差应该为0，用它可以检验平均值的准确性。平均绝对差：样本数据中各数据与均值之间的差值的绝对值的均值称为平均绝对差。标准差：方差的平方根称为标准差，标准差是最常用的反映数据离散趋势的统计量。（3）偏度与峰度偏度：偏度是反映数据分布不对称的一个数字特征，其公式：式中，，为变量的阶中心矩。当数据为正态分布时偏度为0。峰度：峰度是以正态分布为标准描述该分布密度的形状为陡峭还是平坦的一个数字特征，计算公式为：当数据呈现正态分布时，峰度为0。二、SPSS实现用鼠标指向Analyze菜单条中的DescriptiveStatistics选项，打开响应的子菜单，该子菜单中提供了多个过程来实现样本数据的描述。下面分别进行介绍。（1）频数分析过程该过程就是通过数据频数分析来达到整理数据的目的，利用该过程，得到一系列描述数据分布状况的统计量。对话框介绍在DescriptiveStatistics子菜单中单击Frequencies选项，打开Frequencies对话框，如下图所示；变量名列表框：对话框左侧的变量名列出了当前数据文件中所有的变量的变量名。Variable(s)：在变量名列表框中单击文件名之后，单击对话框中间的箭头按钮，将变量名移到该列表框中。选定变量名后，将对选定变量的数据进行频数分析。Displayfrequencytables:选定此项，将在查看器中显示频数分析表，否则只显示直方图，不显示频数表。Statistics按钮:单击该按钮，打开Frequencies:Statistics对话框，如下图所示，该对话框中各个选项的意义如下：1.PercentileValues方框：选择方框内的选项，计算并显示分位数。※Quartiles核选框计算并显示四方位数。※CutPoints核选框在后面的窗口中输入数值，假设为（为2到100之间的整数字），则计算并显示分位数。※Percentile(s)核选框在后面...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

第4章样本描述与数据准备

第4章样本描述与数据准备样本数据采集到以后，不能立即用于数据分析，因为样本可能存在错误数据、缺失数据或者异常数据，或者采集的数据不符合要求，不具有代表性，这些情况会直接影响到分析结果的准确性和准确性

所以，进行数据分析以前，需要首先了解一下样本数据的基本特征，并对缺失值和异常值等进行适当的处理

第一节样本的描述一、基本数学知识样本数据采集到以后，常用一些统计量描述原始数据的集中程度和离散状况，对数据的总体特征进行归纳

（1）描述中心趋势的统计量算术平均数：样本数据的总和除以数据个数得到算术平均数，算术平均数是描述样本数据中心趋势最常用的统计量，因为具有计算简便、稳定的优点

中位数：将样本数据（假设有个数）按照升序或者降序排列，如果为奇数，则数列中间的数为中位数；如果为偶数，则中位数为居中两数的均值

中位数不如算术平均数稳定，即在同一总体中取相同大小的不同样本时，中位数的变化比算术平均数大

但是中位数不受极值的影响，因而在经济统计中应用较多

众数：样本数据中出现频数最大的那个数称为众数

众数容易理解，但是不容易确定，与中位数一样，不受极值的影响

截尾平均数：将样本数据进行排序后，按照一定的比率去掉两端的某些数，对剩下的数据求平均值，得到截尾平均数

常用的截尾平均数有5%截尾平均数，即两端去掉5%的数据以后剩余的数求平均数

截尾平均数与算术平均数相比，较少受极值的影响

几何平均数：个非负数的几何平均数可以表示为：几何平均数应用于任何两个相邻数之比为常数或者接近常数的数据资料

调和平均数：个数的调和平均数可以表示为：其它中心趋向的度量还有某种四分数、十分数和百分数的平均值

其中，分位数是随机变量的一种数字特征，假设连续型随机变量的密度函数是，给定常数，若满足：则称为的分位数

（2）描述离散趋势的统计量仅仅利用描述中心趋势的统计量，不能够反映整个数据集合的分布状况，具有不同分布的数

您可能关注的文档

海纳百川 + 关注: 实名认证
内容提供者

热爱教学事业，对互联网知识分享很感兴趣

收藏店铺进入空间

第4章样本描述与数据准备VIP免费

第4章样本描述与数据准备

您可能关注的文档

相关文档

热门下载

相关标签

第4章 样本描述与数据准备VIP免费

第4章 样本描述与数据准备

您可能关注的文档

相关文档

热门下载

相关标签

第4章样本描述与数据准备VIP免费

第4章样本描述与数据准备