摘 要本课程设计主要运用 MATLAB 的仿真平台设计进行文字识别算法的设计与仿真
也就是用于实现文字识别算法的过程
从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的讨论热点
由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,讨论图片文字提取具有重要的实际意义
又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术
随着计算机科学的飞速进展,以图像为主的多媒体信息迅速成为重要的信息传递媒介,在图像中,文字信息(如新闻标题等字幕)包含了丰富的高层语义信息,提取出这些文字,对于图像高层语义的理解、索引和检索非常有帮助
关键字:文字识别算法;静态图像文字提取;检索目录1 课程设计目的 32 课程设计要求 4 3 相关知识 5 4 课程设计分析 7 5 系统实现 8 6 系统测试与分析 14 6
1 文字识别算法仿真结果 14 6
2 基于字符及单词的识别 14 6
1 基于字符的识别 14 6
2 基于单词的识别 14 6
3 现存算法的问题 15 6
1 大多文字识别方法依赖于人工定义的特征 15 6
2 脱离上下文的字符识别易造成显著的歧义 15 6
3 简单的单词整体识别有着较大的局限性 15 6
4 训练样本制作繁琐 16 7 参考文献 17 1 课程设计目的图像文字提取又分为动态图像文字提取和静态图像文字提取两种,其中,静态图像文字提取是动态图像文字提取的基础,其应用范围更为广泛,对它的讨论具有基础性,所以本文主要讨论静态图像的文字提取技术
静态图像中的文字可分成两大类:一种是图像中场景本身包含的文字, 称为场景文字; 另一种是图像后期制作中加入的文字,称为人工文字,如右图所示
场景文字由于其出现的位置、小、