1 第 一章 数据分析的基础 1.【选择】数据分析的前提是数据的搜集与加工处理
在数据资料进行加工处理时,通常采用对数据进行分组的方法
2.【选择】数据分组是对某一变量的不同取值,按照其自身变动特点和研究需要划分成不同的组别,以便更好地研究该变量分布特征及变动规律
3.【选择】变量数列两要素:①组别——由不同变量值所划分的组;②频数——各组变量值出现的次数
各组次数与总次数之比叫做比率,又称频率
4.【选择】在变量数列中,由不同变量值组成的组别表示变量的变动幅度,而频数和频率则表示相对应的变量值对其平均水平的作用程度
频数(频率)愈大的组所对应的变量值对其平均水平的作用越大;反之,频数(频率)愈小的组所对应的变量值对其平均水平的作用也愈小
5.【案例分析】变量数列的编制(将结合变量数量分布图进行考查) ①确定组数;对于等距分组,斯特吉斯给出一个大致的计算组数的公式:m=1+3
322lgN(变量个数N,组数为 m)
② 确 定 组 距 ; 在组 距 分组 中 ,每 组 的上 限 和 下 限 之 间 的距 离称 为 组 距 等 距 分组 的组 距 为 d : mxxdiimin)max( ③确定组限;当相邻两组中数值较小的一组的上限和数值较大的一组的下限只能用同一数值表示时,为了不违反分组的互斥性原则,一般规定上限不包含在本组之内,称为上限不在内原则
④计算各组的次数(频数); ⑤编制变量数列;将各组变量值按从小到大的顺序排列,并列出相对应的次数,形成变量数列
6.【选择】累计频数和累计频率可概括地反映 变量取值的分布特征
向 上累 计分布曲 线 呈 上升 状 ,向 下累 计分布曲 线 呈 下降 状
组的次数(或 频数)较少 ,曲 线 显 得 平缓 ;组的次数(或 频数)较密 集 ,曲 线 显 得 较陡 峭
7.【选答 】洛伦茨曲线及其绘制方法 (