1 OCR 软件将PDF 文件转换为WORD 格式文件详细图解过程 在日常工作中常遇到需将PDF 文件转换为WORD 格式文件此类问题,由于生成PDF 文件的源文件多种多样,有: 从 word 文件、CAD 制图文件、jpg 文件以及扫描生成的图片文件等,因此企图用一种万能软件去实现是非常困难的
大多数情况是生成以整页为图像的无文字的word 文件,这时就需要用OCR 类软件进行识别处现
将本人实践成功的实例汇总成此文供大家参考: 一、用软件快速将PDF 转换为Word 文件
以汉王 PDF OCR 为例: 1、用汉王 PDF OCR 打开要转换的PDF 文件:以GB 4616-84
pdf 为实例
2、在 “打开图象文件” 界面中点选 “ pdf 转换为 rtf 文件” 2 3、在 “ pdf 转换为rtf” 界面中点选 “全部页页”或“页码范围”及“转换后打开RTF文件”后,点“确定”
注 1: RTF 格式是是一种类似DOC 格式(Word 文档)的文件,有很好的兼容性,大多数的文字处理软件都能读取和保存RTF 文档,比如Word、 WPS Office、 Excel 等都可以打开
3 4、转换完成后软件自动打开新生成的RTF 文件: 此时可点选页面的文字,如能选中文字那就大功告成,那可以另存方法再从rtf 文件转化为常用 doc 格式文件
如果是以整页为图像那就是一份没有文本文字的的RTF 文件,那就就需要进行第二个方案:通过OCR 软件将PDF 转换为WORD 文件
注 2: 在 “打开图象文件” 界面中点选 “ pdf 转换为 txt 文件”,结果或是有文字或无文字的纯文本文件
见下图: 4 二、通过OCR 软件将PDF 转换为Word 文件,仍以汉王 PDF OCR 为例: 1、打开汉王 PDF OCR,依次点“文件”、“打开图像”: 5 2、选定要