电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

第9章光学字符识别技术

第9章光学字符识别技术_第1页
1/97
第9章光学字符识别技术_第2页
2/97
第9章光学字符识别技术_第3页
3/97
第 9章 光学字符识别技术(上) 光学字符识别技术是计算机自动、高速地辨别纸上的文字,并将其转化为可编辑的文本的一项实用技术。它是新一代计算机智能接口的一个重要组成部分,也是模式识别领域的一个重要分支。文字识别技术的研究涉及图像处理、人工智能、形式语言、自动机、统计决策理论、模糊数学、信息论、计算机科学、语言文字学等学科,它是介于基础研究和应用研究之间的一门综合性学科。 随着计算机技术的推广应用,尤其是互联网的日益普及,人类越来越多地依赖计算机获得各种信息,大量的信息处理工作也都转移到计算机上进行。在日常生活和工作中,存在着大量的文字信息处理问题,因而将文字信息快速输入计算机的要求就变得非常迫切。现代社会的信息量空前丰富,其中绝大部分信息又是以印刷体的形式进行保存和传播的,这使得以键盘输入为主要手段的计算机输入设备变得相形见绌,输入速度低已经成为信息进入计算机系统的主要瓶颈,影响着整个系统的效率。因此,要求有一种能将文字信息高速、自动地输入计算机的方法。目前,文字输入方法主要有键盘输入、手写识别、语音输入和机器自动识别输入等。人工键盘输入方法需要经过一定时间的学习训练才能掌握;手写识别和语音输入虽然简单便捷,但其输入速度不高,对于大量已有的文档资料,采用这些方法要花费大量的人力和时间。因此,能够实现文字信息高速、自动输入的只能是计算机自动识别技术,即光学字符识别(OCR)技术。 目前文字识别技术已经广泛地应用到了各个领域中。它作为计算机智能接口的重要组成部分,在信息处理领域中可以大大提高计算机的使用效率,是办公自动化、新闻出版、计算机翻译等领域中最理想的输入方式;将庞大的文本图像压缩成机器内码可以节省大量的存储空间。 本章和第 10 章主要介绍光学字符识别中的一些关键技术,包括预处理、字符分割、特征提取、 分类器设计以及后处理等。另外,会给出一些相关的算法代码。当然给出的代码只是一个雏形,只要 读者在这个框架的基础上作修改,就可以构建自己的应用系统。 本章首先介绍了预处理技术及特征提取技术,其他技术将在第 10 章作详细介绍。 9.1 概述 这一小节从总体上介绍光学字符识别技术。 9.1.1 文字识别系统的构成 印刷体文字识别的原始图像是通过扫描仪、CCD 器件或传真机等获得的二维图像,它可以是灰度 (Grayscale)或二值(Binary)图像,其识别过程如图 9-1 所示,它包括 6 个组成部...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

第9章光学字符识别技术

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部