紫光文字识别软件一、软件说明紫光以清华大学电子工程系为技术依托,隆重推出“基于识别的原文重现”自动电子出版物制作系统(TH-OCR紫光专业版)
该系统通过了国家教育部组织的专家鉴定会的鉴定
该出版系统是国内外首次推出的能同时识别超大字符集(13051字)和超多种汉字字体(近百种)、并且将电子文档的错误率降低到万分之一以下的、能将复杂报纸杂志文档经版面分析、识别、理解,最后自动精确重构为原式原样的标准格式电子文档的电子出版系统,为我国信息资源建设提供了一个快捷、高效的系统解决方案,是一个具有划时代意义的创举
TH-OCR紫光专业版是一套理想的中英文印刷体自动识别系统,可广泛应用于办公自动化的资料录人、文献建档、资料处理、信息管理、智能翻译等领域
二、软件操作注意:随紫光扫描仪一起赠送的TH-OCR紫光专业版,需要与紫光扫描仪配套使用,请在正确安装紫光扫描仪之后使用
11、、软件界面及功能说明软件界面及功能说明在不同的操作状态,分别有图像版面分析和编辑修改两种界面
软件界面一:图像版面分析界面软件界面二:编辑修改界面后改编工具条工具条中各快捷作按钮的功能说明如下:打开扫描打印识别倾斜校正旋转图像缩小竖排正文图形图像全部识别导出版面分析放大横排正文表格识别字体复制撤消前向词汇相似字帮助剪切粘贴查找逆向词汇常用符号22、、操作流程操作流程TH-OCR紫光专业版的操作流程分为设置、获取图像、版面分析、文字识别、编辑修改等五步,如图所示:设置使用系统前应根据应用环境及需求设定系统参数
从“命令”菜单选择“设置”命令,在打开的“设置”对话框中可对系统、扫描、识别、后编改及其它(表格、版面分析等)参数进行设定
这些参数一般按默认设置即可
获取所要识别的图像文件获取所要识别的图像文件有两种方式:通过扫描仪扫描新的图像或打开已有图像文件
如果要扫描新的图像,则应从“文件”菜单选择“扫描”命令或