基于模板匹配的印刷号码识别研究贾军锋(西安西正印制有限公司)摘要:随着技术的进步,对号码进行在线识别检测已经成为票据印刷中减少缺陷号码,提高产品质量的必然趋势
本文研究了基于模板匹配的印刷号码自动识别系统,实现了对号码图像的自动识别
关键词:模板匹配;号码识别1引言模板匹配是字符图像识别最重要的一种方法
为了实现模板匹配,首先要得到识别字符的标准模板,模板匹配识别的过程是把待识别字符图像和标准模板进行比较的过程
本文对金融票据号码进行分析研究,用采集来的号码图像制作标准字体模板,然后通过模板匹配对字符图像进行图1-1识别过程识别,得到识别结果
整个识别过程如图1-1所示
2预处理图像的预处理就是用一系列的特定操作来改变图像的像素以达到特定目的的
一般来说,它应该包含图像的噪声去除、图像边缘锐化和二值化
1噪声去除图像预处理的目的在于去除孤立的噪声点,使图像画面清晰,以便提取字符特征进行识别
噪声去除是很必要的图像预处理步骤
常见的噪声去除方法有均值滤波法、高斯滤波法、中值滤波法等
由于号码字符主要由笔画线条组成,采用均值滤波或高斯滤波会造成字符边缘模糊,所以本文采用中值滤波法对图像进行去噪处理,滤波效果如图2-1所示
2图像边缘锐化锐化的主要目的在于突出图像中的细节或者增强被模糊了的细节,比如号码图像中号码边缘就是必需要增强的特征信息
本(a)原图(b)中值滤波图2-1滤波效果文采用拉普拉斯算子作为图像边缘增强的滤波器,选用3×3模板,各个像素点的权值如图2-2所示,处理效果如图2-3所示
3图像的二值化图像的二值化是通过图像的阈值分割来实现的
由于阈值分割能将灰度图像转换为二值图像,不仅可以大量压缩数据减少存储量,而且能简化其后的分析和处理步骤
根据阈值选取方法的不同,二值化方法主要分为三类:全局阈值法、局部阈值法和动态阈值法
由于在印刷号码在线检测识别系统中