统计学的概念统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性
统计学的分类:描述统计和推断统计描述统计:是用图形、表格和概括性的数字对数据进行描述的统计方法
推断统计:是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法
统计数据误差的分类:非抽样误差和抽样误差非抽样误差:是由于调查过程中各有关环节工作失误造成的
是可以避免的抽样误差:是利用样本推断总体时产生的误差
是不可避免的,但可以计量和控制
①总体:所研究的全部个体(数据 ) 的集合,是唯一的,确定的,其中的每一个个体也称为元素(总体单位)
总体容量N 分为有限总体和无限总体②样本:从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量或样本量n ③变量:是总体中个体单位所具有的特征或特性变量的具体表现称为变量值,即数据④变量可以分为分类变量 (categorical variable) :说明事物类别的名称
如性别(男,女)特点:只能用文字表示,无大小,平行排列顺序变量 (rank variable) :说明事物有序类别的名称
特点:只能用文字表示,有大小,可排序数值型变量 (metric variable) :说明事物数字特征的名称
如:成绩、年龄、产量
特点:可用数字表示
分类变量和顺序变量属于定性变量数值型变量属于定量变量第二章5
①统计数据的分组:是将预处理过的数据按照某种特征或标准分成不同的组别
分组的作用:突出了组间差异,而掩盖了组内差异② 按定性指标分组------- 品质标志分组按定量指标分组------- 数量标志分组③数量标志分组--编制次数分布表单变量值分组:指每个组值只用一个具体的变量值表现的数列编制条件:变量是离散变量,变量的不同取值个数较少
同时具备组距分组:指每个组的变量值用一个区间来表现编制条件