应用统计学-统计数据的搜集-学生版精讲课件•统计数据的类型和来源•统计数据的描述性分析•统计数据的可视化•抽样调查和推断•统计数据的误差分析•统计数据的应用和案例分析01统计数据的类型和来源统计数据的类型定量数据分类数据间隔数据数值数据,可以进行数学按照某种特征进行分类的两个连续等级之间的数据。运算。数据。比率数据定性数据顺序数据具有实际意义的绝对数值非数值数据,不能进行数具有某种顺序的数据。数据。学运算。统计数据的来源直接来源通过调查、观测、实验等方式直接获取数据。间接来源通过文献资料、网络等途径获取二手数据。调查问卷的设计确定调查对象控制问卷长度确定调查的对象和范围。问卷不宜过长,避免被调查者产生疲劳感。明确调查目的选择合适的题型设计合理的顺序选择适合的题型,如单选、多选、填空等。问题排列要有逻辑顺序,便于被调查者理解和回答。设计问卷前要明确调查的目的和需求。02统计数据的描述性分析数据的集中趋势010203平均数中位数众数描述一组数据的集中位置,反映数据的"中心"位置。描述一组数据的中等水平,即有一半数据小于该值,一半数据大于该值。描述一组数据的出现频率最高的数据,即最能代表这组数据的"多数"水平。数据的离散程度标准差方差的平方根,描述一组数据与平均数之间的离散程度,即每个数据点与平均数之间的差异的平均数的平方根。方差描述一组数据与平均数之间的离散程度,即每个数据点与平均数之间的差异的平均数。四分位数间距描述一组数据中极值之间的差距,反映数据的离散程度。数据分布的偏态和峰态偏态描述一组数据的分布形态是否对称,即数据向左或向右偏斜的程度。正偏态表示数据向右偏斜,负偏态表示数据向左偏斜。峰态描述一组数据的分布形态是否尖锐或扁平,即数据分布的集中程度。峰态过高表示数据分布过于集中,峰态过低表示数据分布过于扁平。03统计数据的可视化柱状图和饼图柱状图用于展示不同类别的比较,通过柱子的高度反映数据的差异。饼图用于展示整体中各部分的占比关系,通过扇形面积反映各部分所占比例。散点图和折线图散点图用于展示两个变量之间的关系,通过点的分布反映两者之间的关系。折线图用于展示一个变量随时间或其他变量的变化趋势,通过线的起伏反映数据的变动情况。箱线图和直方图箱线图用于展示数据的分布情况,包括上下四分位数、中位数、均值等统计指标。直方图用于展示数据分布的频率情况,通过条形的面积反映各组数据的频数。04抽样调查和推断抽样调查的基本概念抽样调查的定义抽样调查是一种统计学方法,通过从总体中选取部分个体(样本)来获取有关总体信息。抽样调查的特点抽样调查具有高效、经济、灵活等优点,是实际应用中常用的方法。抽样调查的适用范围抽样调查适用于各种数据类型和调查目的,尤其在大数据时代,抽样调查更显重要。抽样调查的组织方式简单随机抽样分层随机抽样系统随机抽样将总体中的个体随机抽取出来组成样本,保证每个个体有同等被抽到的概率。将总体按照某种特征分成若干层,然后在每层中随机抽取一定数量的个体组成样本。将总体中的个体按照一定顺序排列,然后以固定间隔的方式抽取一定数量的个体组成样本。样本量的确定样本量的影响因素样本量的计算方法样本量的意义样本量的确定受到多种因素的影响,如总体的规模、精度要求、允许误差大小、置信水平等。根据具体情况和需求,可以采用不同的方法来计算样本量,如使用t分布计算、使用卡方分布计算等。合理的样本量能够提高调查的精度和可靠性,同时避免浪费和不必要的成本。05统计数据的误差分析误差的来源和种类误差来源误差主要来源于调查设计、样本选择、数据采集、数据处理等环节。误差种类误差可分为抽样误差和非抽样误差。抽样误差是由样本的随机性引起的,而非抽样误差则是由调查设计、样本选择、数据采集、数据处理等环节的错误或误差引起的。随机误差和系统误差随机误差随机误差是由样本的随机性引起的,其大小和方向都是随机的,不可预测。例如,在调查中,被调查者的回答可能因为其主观判断的不同而产生随机误差。系统误差系统误差是由某种固定因素引起的,其大小和方向...