第一章 数据分析得基础1、【选择】数据分析得前提就就是数据得搜集与加工处理
在数据资料进行加工处理时,通常采纳对数据进行分组得方法
2、【选择】数据分组就就是对某一变量得不同取值,根据其自身变动特点与讨论需要划分成不同得组别,以便更好地讨论该变量分布特征及变动规律
3、【选择】变量数列两要素:① 组别——由不同变量值所划分得组;② 频数——各组变量值出现得次数
各组次数与总次数之比叫做比率,又称频率
4、【选择】在变量数列中,由不同变量值组成得组别表示变量得变动幅度,而频数与频率则表示相对应得变量值对其平均水平得作用程度
频数(频率)愈大得组所对应得变量值对其平均水平得作用越大;反之,频数(频率)愈小得组所对应得变量值对其平均水平得作用也愈小
5、【案例分析】变量数列得编制(将结合变量数量分布图进行考查)① 确定组数;对于等距分组,斯特吉斯给出一个大致得计算组数得公式:m=1+3、322lgN(变量个数N,组数为m)
② 确定组距;在组距分组中,每组得上限与下限之间得距离称为组距等距分组得组距为d:③ 确定组限;当相邻两组中数值较小得一组得上限与数值较大得一组得下限只能用同一数值表示时,为了不违反分组得互斥性原则,一般规定上限不包含在本组之内,称为上限不在内原则
④ 计算各组得次数(频数);⑤ 编制变量数列;将各组变量值按从小到大得顺序排列,并列出相对应得次数,形成变量数列
6、【选择】累计频数与累计频率可概括地反映变量取值得分布特征
向上累计分布曲线呈上升状,向下累计分布曲线呈下降状
组得次数(或频数)较少,曲线显得平缓;组得次数(或频数)较密集,曲线显得较陡峭
7、【选答】洛伦茨曲线及其绘制方法(1)累计频数(或频率)分布曲线可用来讨论财宝、土地与工资收入得分配就就是否公平,这种累计分布曲线图最早就就是由美国洛伦茨博士提出,故又称洛伦茨曲线图
洛伦茨曲线,对角线为绝对平