模式识别在手写数字识别中研究摘要:手写体数字识别是文字识别中的一个研究课题,是多年来的研究热点,也是模式识别领域中最成功的应用之一。由于识别类型较少,在实际生活中有深远的应用需求,一直得到广泛的重视,通过对数据采集的预处理,特征提取与选择,建立相应的知识库,应用模式识别的方法来进行研究。关键字:模式识别手写数字识别特征提取预处理Abstract:Handwrittennumeralrecognitionofcharacterrecognitionisaresearchtopic,isthehotresearchtopicformanyyears,butalsoisoneofthemostsuccessfulapplicationinthefieldofpatternrecognition.Duetotheidentificationtypeless,ithasaprofoundapplicationrequirementinreallife,hasbeenwidelyattention,andthroughthedataacquisitionpreprocessing,featureextractionandselection,theestablishmentofthecorrespondingknowledgebase,theapplicationofpatternrecognitionmethodforresearchKeyword:patternrecognitionhand-writtennumeralrecognitionfeatureextractionpreprocessing1.引言手写数字识别(HandwrittenNumeralRecognition)是光学字符识别技术(OpticalCharacterRecognition,简称OCR)的一个分支,它研究的对象是,如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个OCR领域中,最为困难的就是脱机手写字符的识别,到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广。字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。在整个OCR领域中,最为困难的就是脱机自由手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距离实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。本文首先介绍了自由手写体数字识别的基本原理,包括数字图像预处理、特征提取和模式识别的基本原理和方法;其次介绍了;最后通过基于MATLAB的实验结果,对本系统的性能进行了分析。2.手写数字识别的原理手写数字的写法带有明显的地区性和民族性,因而选择一个可供系统训练和测试使用的样本库是手写数字识别研究的重要基础之一,对识别系统的性能也有重要的影响。研究者对所需的样本库有两种选择:一是自己根据需要建立专门的样本库,二是选用其它机构做好的现成的样本库。本系统主要由手写体数字识别的训练过程和识别过程组成,训练过程和识别过程均包括预处理、特征提取和模式识别三部分,流程图如图2.1图2.1总之,从手写体数字识别原理可见,手写体数字识别技术主要包括以下几点:(1)数据采集预处理,包括彩色图像转成灰度图像、二值化,归一化,滤除干扰噪声等,如下图;图2.2原始图像图2.3预处理后图像识别过程训练过程数据采集,预处理特征提取与选择分类识别数据采集,预处理分类识别改进数据采集,预处理改进分类识别待识对象训练样本人工干预特征提取与选择改进特征提取与选择正确率测试(2).特征提取与选择,特征提取是字符识别中的一个重要组成部分,是模式识别的核心之一。经过预处理后,根据识别方法的要求抽取图像特征,作为识别的依据。一般而言,选择的特征一方面要求能够足够代表这个图像模式,另一方面要求它们的数量尽可能少,这样能有效地进行分类和较小的计算量。特征提取的好坏会直接影响其识别的分类效果,进而影响识别率,因此特征选择是模式识别的关键。但是,目前还没有一个有效的、一般的抽取、选择特...