基于神经网络的印刷体数字识别算法的研究摘要印刷体数字识别(printednumeralrecognition)是光学字符识别技术(opticalcharacterrecognition,ocr)的一个分支,是文字识别的重要组成部分
本文以vc为平台,运用人工神经网络的思想(主要采用bp神经网络),实现了对印刷体数字识别
关键词数字识别;图像预处理;特征提取;神经网络引言目前,识别技术已经广泛地应用到了各个领域中
为了达到对一幅图像中的数字进行识别的目的,我们要对图像进行一些处理,这些处理工作的好坏直接决定了识别的质量,这些处理技术依次为图像的读取、对读取的图像进行灰度变换、按照量化指标对灰度变换后的图像进行二值化、然后对二值化后的图像中的字符信息进行切分等
在进行完上述预处理工作后进行特征提取,再输入到已经训练好的bp网络进行识别
1识别的流程识别的流程按照引言中的步骤进行,主要分为两大部分,第一部分为图像的预处理、第二部分为通过神经网络进行印刷体数字的识别
预处理部分的流程:图像输入-灰度变换-图像二值化-紧缩重排-归一化调整-图像分割-特征提取
神经网络数字识别的具体流程:样本训练-字符特征输入-识别并给出结果
2基于神经网络的特征提取算法概述图像在经过了前期的预处理后,由原来杂乱无章的字符变为了整齐排列的、大小相同的一列字符,在这里图像归一化后的宽度为8像素,高度为16像素,这样就大大方便了对字符特征的提取
我们把提取的特征存储在特征向量里,然后把特征向量输入到神经网络中,这样就可以对字符进行识别了
由以上的论述我们可以得出结论,特征提取的算法是整个识别过程的关键,它的好坏直接决定了识别的成败
对图像中的字符进行特征提取的算法有很多,下面对几种重要的分别进行介绍
1骨架特征提取法由于图像的来源不同,这就使得图像的线条所使用的像素不同,在图像上表现出来就是线条的粗细