数据分析处理技术 主讲教师简介:郑军,女,辽宁税专第一教学部教师,副教授
导 论 一、 什么是统计学 1、统计是处理数据的一门科学
2、统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法
3、数据分析所用的方法可分为描述统计方法和推断统计方法
二、理解统计对每个人都是必要的
第一部分 数据的整理与图示 一、数据的类型 按照采用的计量尺度不同,可以将数据分为分类数据、顺序数据和数值型数据
1、分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述
如:企业按行业分类等
为便于统计处理,对于分类数据可以用数字代码表示各类别,如用 1表示制造业,2表示建筑业等
2、顺序数据:是只能归于某一有序类别的非数字型数据
顺序数据虽然也有类别,但这些类别是有序的
如将产品分为一等品、二等品、三等品、次品等
同样,对顺序数据也可以用数字代码来表示
3、数值型数据:是按照数字尺度测量的观测值,其结果表现为具体的数值
现实中所处理的大多数都是数值型数据
品质数据(分类数据和顺序数据、定性数据) 数量数据(数值型数据、定量数据) 4、区分数据的类型十分重要
因为对不同类型的数据,需要采用不同的方法来处理和分析
二、数据的搜集 1、数据的来源(数据的间接来源、直接来源)
2、调查数据(概率抽样、非概率抽样)
概率抽样(即随机抽样):常用的方式有简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样
非概率抽样:常用的方式有方便抽样、判断抽样(重点抽样、典型抽样)、自愿样本、滚雪球抽样 3、搜集数据的基本方法(自填式、面访式、电话式、)
4、数据的误差(抽样误差、非抽样误差)
抽样误差(由于抽样的随机性引起的样本结果与总体真值间的误差) 非抽样误差(回答误差、调查员误差等) ★ 三、数