数 据 质 量 检 查 与 质 量 控 制要想清楚并深层次的了解数据质量检查与质量控制的原理,首先应该知道数据质量的基本概念以及数据误差的来源
因为在某些情况下,数据质量问题在很大程度上可以看作是数据误差问题
下面我就详细的为大家介绍数据质量的基本概念和误差来源及其分析,并就其误差,我们再结合相应的检查方法进行精度分析的探讨
一、数据质量的基本概念1、准确性( Accuracy )即一个记录值 (测量或观察值) 与它的真实值之间的接近程度
这个概念是相当抽象的,似乎人们已经知道存在这样的事实
在实际中,测量的知识可能依赖于测量的类型和比例尺
一般而言,单个的观察或测量的准确性的估价仅仅是通过与可获得的最准确的测量或公认的分类进行比较
空间数据的准确性经常是根据所指的位置、拓扑或非空间属性来分类的
它可用误差( Error )来衡量
2、精度( Precision )即对现象描述的详细程度
如对同样的两点,精度低的数据并不一定准确度也低
精度要求测量能以最好的准确性来记录,但是这可能误导提供了较大的精度,因为超出一个测量仪器的已知准确度的数字在效率上是冗于的
因此,如果手工操作的数字化板所返回的坐标不可能依赖于比0
1mm 还要准确的一个“真正的”数值,那么就不存在任何的点,在十分之一的地方是以mm 表示的
3、空间分辨率 (Spatial Resolution) 分辨率是两个可测量数值之间最小的可辩识的差异
那么空间分辨率可以看作记录变化的最小距离
在一张用肉眼可读的地图上,假设一条线用来记录一个边界,分辨率通常由最小线的宽度来确定
地图上的线很少以小于0
1mm 的宽度来画
在一个图形扫描仪中最细的物理分辨率从理论上讲是由设施的像元之间的分离来确定的
在一个激光打印机上这是一英寸的 300 分之一, 而且在高质量的激光扫描仪上,这会细化十倍
如果没有放大,最细的激光