第 9章 光学字符识别技术(上) 光学字符识别技术是计算机自动、高速地辨别纸上的文字,并将其转化为可编辑的文本的一项实用技术
它是新一代计算机智能接口的一个重要组成部分,也是模式识别领域的一个重要分支
文字识别技术的研究涉及图像处理、人工智能、形式语言、自动机、统计决策理论、模糊数学、信息论、计算机科学、语言文字学等学科,它是介于基础研究和应用研究之间的一门综合性学科
随着计算机技术的推广应用,尤其是互联网的日益普及,人类越来越多地依赖计算机获得各种信息,大量的信息处理工作也都转移到计算机上进行
在日常生活和工作中,存在着大量的文字信息处理问题,因而将文字信息快速输入计算机的要求就变得非常迫切
现代社会的信息量空前丰富,其中绝大部分信息又是以印刷体的形式进行保存和传播的,这使得以键盘输入为主要手段的计算机输入设备变得相形见绌,输入速度低已经成为信息进入计算机系统的主要瓶颈,影响着整个系统的效率
因此,要求有一种能将文字信息高速、自动地输入计算机的方法
目前,文字输入方法主要有键盘输入、手写识别、语音输入和机器自动识别输入等
人工键盘输入方法需要经过一定时间的学习训练才能掌握;手写识别和语音输入虽然简单便捷,但其输入速度不高,对于大量已有的文档资料,采用这些方法要花费大量的人力和时间
因此,能够实现文字信息高速、自动输入的只能是计算机自动识别技术,即光学字符识别(OCR)技术
目前文字识别技术已经广泛地应用到了各个领域中
它作为计算机智能接口的重要组成部分,在信息处理领域中可以大大提高计算机的使用效率,是办公自动化、新闻出版、计算机翻译等领域中最理想的输入方式;将庞大的文本图像压缩成机器内码可以节省大量的存储空间
本章和第 10 章主要介绍光学字符识别中的一些关键技术,包括预处理、字符分割、特征提取、 分类器设计以及后处理等
另外,会给出一些相关的算法代码
当然给出的代