用Java从Doc和Docx格式的Word文档中提取图片Doc和Docx的文档格式因为存储格式不一样,所以需要用不通的方法提取图片
Docx格式的文档实际上是压缩文件,用程序提取图片相对实际上只需要对文章进行解压缩,然后到指定文件夹找到图片即可
Doc文档则需要把图片数据读出来,再生成文件
下面代码均可直接运行
从Docx文件中提取图片的代码:packagecom
docx;importjava
BufferedInputStream;importjava
BufferedOutputStream;importjava
File;importjava
FileOutputStream;importjava
Enumeration;importjava
ZipEntry;importjava
ZipFile;publicclassImgExt4Docx{/***@paramargs*/staticfinalintBUFFER=2048;publicstaticvoidmain(String[]args){StringinputFilename="D:/work/test
docx";StringunZipPathname="D:/work/unZipDir/";ImgExt4Docxied=newImgExt4Docx();System
println(ied
unZipDocx(inputFilename,unZipPathname));}/**returnthefoldoftheimages*/publicStringunZipDocx(Stringdocxfile,StringdestDir){try{StringinputFilename=docxfile;StringunZip