统计学知识点汇总第一章:统计学是收集、处理、分析、解析数据并从数据中得出结论的科学.分类:描述统计、推断统计。描述统计是讨论数据收集、处理和描述的统计学方法。 推断统计是讨论如何利用样本数据来推断总体特征的统计学方法(内容包括参数估量和假设检验)。变量:每次观察都会得到不同结果的某种特征。 分类变量:又称无序分类变量,观测结果表现为某种类别的变量。 顺序变量:又称有序分类变量,观测结果表现为某种有序类别的变量。数值变量:又称定量变量,观测结果表现为数字的变量。数据:1、分类数据 2、顺序数据 3、数值型数据总体:包含所讨论的全部个体(数据)的集合。样本:从总体中抽取的一部分元素的集合.样本量:构成样本元素的数目。抽样方法:1、简单随机抽样 2、分层抽样 3、系统抽样 4、整群抽样简单随机抽样:从含有 N 个元素的总体中,抽取 n 个元素组成一个样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。分层抽样:也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。软件应用:用 Excel 抽取简单随机样本。第二章:一、定性数据的图示:1、条形图 2、帕累托图 3、饼图 4、环形图条形图:是用宽度相同的条形来表示数据多少的图形,用于观察不同类别的多少或分布状况。帕累托图:是按各类别出现的频数多少排序后绘制的条形图。通过对条形的排序,容易看出哪类频数出现的多,哪类出现的少。饼图:主要用于表示一个样本(或总体)中各类别的频数占全部频数的比例。用图表展示定量数据:生成定量数据的频数分布表时,需要先将原始数据根据某种标准分成不同的组别,然后统计出各组别的数据频数即可。一组数据所分的组数 K 应不少于 5 组且不多于 15 组。组距=(最大值—最小值)/组数 组数=全距 /组距每组组距均相等称为等距数列,反之则为异距数列 在比较等距数列与异距数列的次数分布时常用:次数密度=本组次数/本组组距 2。组中值 class midpoint 组中值=(本组上限+本组下限)/2 或组中值=(本组假定上限+本组假定下限)/2二、定量数据的图示:1、分组数据看分布:直方图 2、未分组数据看分布:茎叶图和箱线图、垂线图和误差图 最小值 25%四分位数 中位数 75%四分位数 最大值箱线图的示意图:3、两个变量间的关系:散点图是用二维坐标展示两个变量之间关系的一种图形。4、比较多个样本的相似性:雷达图和轮廓图雷达图是从...