一二章、绪论现代统计学之父:皮尔逊描述统计与推断统计描述统计主要讨论如何整理、描述数据的特征。推断统计主要讨论如何通过局部数据所提供的信息推论总体特征。变量类型定类变量:如,性别、学号、颜色类别、教学方法。特征:没有绝对零点,没有测量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。定序变量:程度、等级和水平。如,竞赛名次、品质等级、喜爱程度特征:既无零点、又无测量单位。变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。如温度、测验成绩、智商。特征:有相等的测量单位,无绝对零点。考试成绩为零不表示没有一点知识。可进行加减运算,乘除运算则无意义。定距变量:如身高、重量、学生人数。既有测量单位,又有绝对零点,可进行计算。降低偏差:利用随机抽样降低变异性:用大一点的样本三、描述统计一、频数:某一事件在某一类别中出现的次数。频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。分布性质;集中(分散)程度,偏度和峰度不同。偏态系数:数据的对称性峰态系数:数据的峰度二、集中量数:包括算术平均数、中位数、众数(用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数、几何平均数、调和平均数。组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。算数平均数的性质(算法必须会):(1)每一个变量加减或乘除一个数之后,均值也相应增加。(2)变量值与均值的离均差之和为零。(3)变量值与均值的离均差平方和为最小值。三、离散量数:全距 R、四分位差 Q、平均差 A.D、方差(样本统计量总体参数)、标准差(s 或者 SD)、百分位差全距:全部数据中的最大值与最小值的差 ,描述了数据分布的围 。四分位差(Q):样本中间 50%的人的全距的一半。是一个距离,Q 越大,表示样本中各样品越不整齐.平均差:全部数据与均值绝对离均差的均值。方差:各个数据偏离中心的程度。方差越大,数据波动越大。标准差:方差的算术平方根。自由度:自由度是指当以样本的统计量来估量总体的参数时,样本中独立或能自由变化的数据的个数。标准分数:以标准差为单位表示一个原始分数在团体中所处的相对位置,即原始分数在均值以上或以下几个标准差的位...