1 第一章 数据分析的基础1.【选择】 数据分析的前提是数据的搜集与加工处理。在数据资料进行加工处理时,通常采用对数据进行分组的方法。2.【选择】 数据分组 是对某一变量的不同取值,按照其自身变动特点和研究需要划分成 不同的组别 ,以便更好地研究该变量分布特征及变动规律。3.【选择】变量数列两要素 :①组别 ——由不同变量值所划分的组;②频数 —— 各组变量值出现的次数。各组次数与总次数之比叫做比率,又称频率 。4.【选择】 在变量数列中, 由 不同变量值组成的组别表示变量的 变动幅度 ,而频数和频率 则表示相对应的变量值对其 平均水平的作用程度。频数(频率) 愈大 的组所对应的变量值对其平均水平的作用越大;反之,频数(频率)愈小的组所对应的变量值对其平均水平的作用也愈小。5.【案例分析】变量数列的编制(将结合变量数量分布图进行考查)①确定组数 ;对于等距分组, 斯特吉斯给出一个大致的计算组数的公式:m=1+3.322lgN(变量个数N,组数为 m)。② 确 定 组 距 ; 在 组 距 分 组 中 , 每 组 的 上 限 和 下 限 之 间 的 距 离 称 为 组 距 等 距 分 组 的 组 距 为d :mxxdiimin)max(③确定组限 ;当相邻两组中数值较小的一组的上限和数值较大的一组的下限只能用同一数值表示时,为了不违反分组的互斥性原则,一般规定上限不包含在本组之内,称为上限不在内原则。④计算各组的次数(频数 );⑤编制变量数列 ;将各组变量值按从小到大的顺序排列,并列出相对应的次数,形成变量数列。6.【选择】 累计频数和累计频率可概括地反映 变量取值的分布特征。向上累计分布曲线呈上升状,向下累计分布曲线呈下降状。组的次数(或频数)较少,曲线显得平缓;组的次数(或频数)较密集,曲线显得较陡峭。7.【选答】 洛伦茨曲线及其绘制方法(1)累计频数(或频率)分布曲线可用来研究 财富、土地和工资收入的分配是否公平,这种累计分布曲线图最早是由美国洛伦茨博士提出,故又称洛伦茨曲线图。洛伦茨曲线,对角线为绝对平等线。根据实际收入分配线与绝对平等线或绝对不平等进行对比可衡量其不平等程度。离绝对平等线越远,分配越不平等;反之,越靠近绝对平等线,分配越平等。(2)首先,将分配的对象和接受分配者的数量均化成结构相对数并进行向上累计;其次, 纵轴和横轴均为百分比尺度 ,纵轴 自下而上, 用以 测定分配的对象( 如一国...