Android 开发笔记(一百四十一)读取PPT 和 PDF 文件读取 ppt 文件读取纯文本HSLFSlideShow 类就是 poi 中专门用于解析幻灯片的工具类,每幻灯片又分别由单独的HSLFSlide 类处理,幻灯片中的具体图文容则由 HSLFTextParagraph 和 HSLFTextRun 进行分辨
下面是使用 poi 解析 ppt 文件(2024 格式)的效果图:不同版本的 poi 库在解析 ppt 的代码略有区别,下面是使用 poi15 读取 ppt 的代码:[java] view plain copypublic static ArrayList readPPT(String path) { ArrayList contentArray = new ArrayList(); try { FileInputStream fis = new FileInputStream(new File(path)); HSLFSlideShow hslf = new HSLFSlideShow(fis); List slides = hslf
getSlides(); for (int i = 0; i < slides
size(); i++) { String content = ""; HSLFSlide item = slides
get(i); // 读取一幻灯片的容(包括标题) List tps = item
getTextParagraphs(); for (int j = 0; j < tps
size(); j++) { List tps_row = tps
get(j); for (int k = 0; k < tps_row
size(); k++) { HSLFTextParagraph tps_item = tps_row
get(k); L