第9章光学字符识别技术

下载本文档

阅读 51
下载 26
格式 pdf
大小 2.11 MB
约97页
2025-03-18 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/97页

2/97页

3/97页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/97

文本预览下载提示常见问题

第 9章光学字符识别技术（上）光学字符识别技术是计算机自动、高速地辨别纸上的文字，并将其转化为可编辑的文本的一项实用技术。它是新一代计算机智能接口的一个重要组成部分，也是模式识别领域的一个重要分支。文字识别技术的研究涉及图像处理、人工智能、形式语言、自动机、统计决策理论、模糊数学、信息论、计算机科学、语言文字学等学科，它是介于基础研究和应用研究之间的一门综合性学科。随着计算机技术的推广应用，尤其是互联网的日益普及，人类越来越多地依赖计算机获得各种信息，大量的信息处理工作也都转移到计算机上进行。在日常生活和工作中，存在着大量的文字信息处理问题，因而将文字信息快速输入计算机的要求就变得非常迫切。现代社会的信息量空前丰富，其中绝大部分信息又是以印刷体的形式进行保存和传播的，这使得以键盘输入为主要手段的计算机输入设备变得相形见绌，输入速度低已经成为信息进入计算机系统的主要瓶颈，影响着整个系统的效率。因此，要求有一种能将文字信息高速、自动地输入计算机的方法。目前，文字输入方法主要有键盘输入、手写识别、语音输入和机器自动识别输入等。人工键盘输入方法需要经过一定时间的学习训练才能掌握；手写识别和语音输入虽然简单便捷，但其输入速度不高，对于大量已有的文档资料，采用这些方法要花费大量的人力和时间。因此，能够实现文字信息高速、自动输入的只能是计算机自动识别技术，即光学字符识别（OCR）技术。目前文字识别技术已经广泛地应用到了各个领域中。它作为计算机智能接口的重要组成部分，在信息处理领域中可以大大提高计算机的使用效率，是办公自动化、新闻出版、计算机翻译等领域中最理想的输入方式；将庞大的文本图像压缩成机器内码可以节省大量的存储空间。本章和第 10 章主要介绍光学字符识别中的一些关键技术，包括预处理、字符分割、特征提取、分类器设计以及后处理等。另外，会给出一些相关的算法代码。当然给出的代码只是一个雏形，只要读者在这个框架的基础上作修改，就可以构建自己的应用系统。本章首先介绍了预处理技术及特征提取技术，其他技术将在第 10 章作详细介绍。 9.1 概述这一小节从总体上介绍光学字符识别技术。 9.1.1 文字识别系统的构成印刷体文字识别的原始图像是通过扫描仪、CCD 器件或传真机等获得的二维图像，它可以是灰度（Grayscale）或二值（Binary）图像，其识别过程如图 9-1 所示，它包括 6 个组成部...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

第9章光学字符识别技术

第 9章光学字符识别技术（上）光学字符识别技术是计算机自动、高速地辨别纸上的文字，并将其转化为可编辑的文本的一项实用技术

它是新一代计算机智能接口的一个重要组成部分，也是模式识别领域的一个重要分支

文字识别技术的研究涉及图像处理、人工智能、形式语言、自动机、统计决策理论、模糊数学、信息论、计算机科学、语言文字学等学科，它是介于基础研究和应用研究之间的一门综合性学科

随着计算机技术的推广应用，尤其是互联网的日益普及，人类越来越多地依赖计算机获得各种信息，大量的信息处理工作也都转移到计算机上进行

在日常生活和工作中，存在着大量的文字信息处理问题，因而将文字信息快速输入计算机的要求就变得非常迫切

现代社会的信息量空前丰富，其中绝大部分信息又是以印刷体的形式进行保存和传播的，这使得以键盘输入为主要手段的计算机输入设备变得相形见绌，输入速度低已经成为信息进入计算机系统的主要瓶颈，影响着整个系统的效率

因此，要求有一种能将文字信息高速、自动地输入计算机的方法

目前，文字输入方法主要有键盘输入、手写识别、语音输入和机器自动识别输入等

人工键盘输入方法需要经过一定时间的学习训练才能掌握；手写识别和语音输入虽然简单便捷，但其输入速度不高，对于大量已有的文档资料，采用这些方法要花费大量的人力和时间

因此，能够实现文字信息高速、自动输入的只能是计算机自动识别技术，即光学字符识别（OCR）技术

目前文字识别技术已经广泛地应用到了各个领域中

它作为计算机智能接口的重要组成部分，在信息处理领域中可以大大提高计算机的使用效率，是办公自动化、新闻出版、计算机翻译等领域中最理想的输入方式；将庞大的文本图像压缩成机器内码可以节省大量的存储空间

本章和第 10 章主要介绍光学字符识别中的一些关键技术，包括预处理、字符分割、特征提取、分类器设计以及后处理等

另外，会给出一些相关的算法代码

当然给出的代

小辰2 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

第9章光学字符识别技术

第9章光学字符识别技术

您可能关注的文档

相关文档

热门下载

相关标签