用Jav a 读取Word 文档 由于Word 的编码方式比较复杂,所以Word 文档不可能通过流的方式直接读取;当然如果Word 可以转化成TXT 文件就可以直接读取了;目前读取Word 比较好的开源工具是Poi 及Jacob,感觉Poi 读取功能要比Jacob 略逊一筹,毕竟Jacob 可以直接调用Word 的COM 组件;但是微软产品不开放源码,所以Jacob 读取Word 文档也只能是摸着石头过河,一点一点破解了
Jacob 读取Word 内容,由于Word 内容的复杂性,读取也是非常不方便的,目前可以有"按段落读取","按书签读取"及"按照表格读取"等几种形式
示例讲解(通过Jav a FileReader,Jacob 两种方式读取Word 内容) 一.通过jav a 流读取Word 内容 复制代码 1
import java
BufferedReader; 2
import java
FileReader; 3
import java
IOException; 4
public class ReadWordByStream { 6
public static void main(String[] args) throws IOException { 7
String rowContent = new String(); 8
String content = new String(); 9
BufferedReader in = new BufferedReader(new FileReader("d:\\test3
doc")); 10
while ((rowContent = in
readLine())
= null) { 11
content = content + rowContent + "\n"; 1