1导论1.1选题目的及意义1.1.1选题目的近年来应用于移动终端的“字符识别”技术,已经应用到到我们的日常生活中了,也应用到了很多的行业,对于这些行业提高了工作效率。一般来说,字符的辨别的方法有很多种,通常分成三类,第一从字符上面来进行分类,可以分成两种,分成脱机和联机识别两类;第二从可以识别的字符上面来进行分类,可以分成印刷体和手写体字符识别两大类(它们属于脱机字符);第三从可以识别的对象上面来进行分类,能够分成数字阿拉伯数字识别和字母进行识别以及汉字识别和外国语言识别(手写);从字符识别来看,能够从字符的多少,分成两大类-限制性识别和不是限制性识别类别。在本次论文中,我主要研究的是手写数字识别,它属于光学字符识别技术,和它有着很大的关系,手写数字识别在模式识别学科范围内,它是一个传统性领域。手写数字识别研究的对象是阿拉伯数字,并且通过电子计算机去如何去认识。随着信息化时代的到来,手写数字识别的普及越来越广,对手写数字识别进行深层次的研究,有着重要的意义,手写数字识别是通过用手写出来时的有序轨迹信息变成汉字的内码,这也是手写数字识别的原理。阿拉伯数字只有10种类型,用笔十分的简单,一般情况上,认识阿拉伯数字不是很难。但实际上,在一些测验结果上,印刷体汉字的识别往往比阿拉伯数字高很多,有的阿拉伯数字还比不上联机手写体汉字,而阿拉伯数字只是简单容易记住,阿拉伯数字只是优于它。那为什么这么多人使用它呢?因为阿拉伯数字尽管只有10种,但写法简单,每个人写出来都不同,有着很大的个人特征,阿拉伯数字很难满足不同的写法很高识别率的通用性数字体系。二零零五年的时候,杭州一所高校(电子工业学院)一位学生(蒙庚详、万景龙)解决了大训练样本问题,他们是怎么解决的?他们是通过支持向量机smo算法去解决了这个问题,然后效率提高了,识别的速度也加快了,得到了广泛的运用。[1]也在二零零五年的时候,长沙理工大学的张鸽和陈书开运用穿越次数特征提高了相应的识别率,并且解决了相应的问题,而且对svm和Bp神经网络速度进行了对比,发现了svm和BP能够解决一部分的问题(bp神经网络),[2]在二零零六年的时候,山东师范大学的学生吴琳琳设计出了svm.hdr系统,这个软件系统设计出来了后,解决了能够发现合适的多种方法和很多数据集的训练算数法,把手写的数字变得格式化,能够找到适合的核函数,提高了svm的有效性,减少了错误的出现[3]。所以,从中可以知道,现在国家和外国在svm的手写识别方面的内容,主要是怎么去用特征提取以及怎么把svm变得更完善,所以,现在svm识别的识别已经变得比较高了,svm的效率也大大提高了。1.1.2选题意义阿拉伯数字是世界上独特得使用语言,而它本身有许多特点,所以对于它的研究就有很重要的意义。其实数字识别在很多领域都能被应用,比如文献系统检索、数字化办公、金融银行数据处理等方面。通常手写体数字识别的研究在一些方面和文化的多少是没有关系的,这样避免了因文化语言等差异而造成的研究上的误差。如果能对手写数字进行准确的识别,可以大大的减少在一些基础工作上的重复。在信息化的社会,也更加速了社会发展。1.教育领域手写数字的识别可用于教育行业,批量批改作业手写识别可以用于批量批改作业,现如今市面上已经有一些相对成熟的产品,比如翌学等。翌学是以教师为核心,帮助老师减负、为学校增效为出发点的一款面向学校教师及学生的智慧服务SaaS平台。利用手写识别系统帮助老师减清负担,为学校增高了效率,帮助教育事业的改革起到了一定的作用。2、大规模数据统计领域处于庞大的数据收集中(有:人口调查,行业年检等),伴随着庞大的数据出现,前期都是手工的搜索,会消耗许多的人力财力物力,而现在数据总计大多趋向于使用ORC技术。由于是在应用程序中,数据的输写是聚集组合的,因此,表格通常可以用特别的设计,并且可以对书写施加制约,用来方便自动辨别机器。当前,大多数国内实用系统都是在用户的指示下进行填写。另外,这些系统经常使用适当的用户界面来完全验证识别结果,最终确保结果是正确的。因此,可以看出,这比较...