电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

PDF文件结构详解

PDF文件结构详解_第1页
1/14
PDF文件结构详解_第2页
2/14
PDF文件结构详解_第3页
3/14
PDF(Portable Document Format,便携式文档结构)就是一种很有用得文件格式,其最大得特点就是平台无关而且功能强大(支持文字/图象/表单/链接/音乐/视频等)、做 PDF 得解析,首先要熟悉 PDF 文件得物理结构与逻辑结构。PDF 文件物理结构可分为以下几块: 1、文件头 文件头就是 PDF 文件得第一行,格式如下: %PDF-1、4 这就是个固定格式,表示这个 PDF 文件遵循得 PDF 法律规范版本,目前 PDF 得生成工具,除了官方得 acrobat,其她生成得以 1、4 版本得居多。对于做 PDF 开发来说,一个最简单得原则就就是生成 PDF 得时候尽量符合低版本法律规范,以保证大多数解析器能支持;解析 PDF 得时候尽量支持高版本得法律规范,以保证支持大多数工具生成得 PDF 文件。从 1、4 版本以后,PDF 文件得版本并不唯一得只就是在这里表示了,可能后面会改写(catalog 得 Version 词条),所以解析 PDF 得时候,假如这里得版本大于等于 1、4,应该再比较一下 catalog 里面得 version,取其中高一点得版本。2、对象集合 这就是一个 PDF 文件最重要得部分,文件中用到得所有对象,包括文本/图象/音乐/视频/字体/超连接/加密信息/文档结构信息等等,都在这里定义。格式如下: 2 0 obj 、、、 end obj 一个对象得定义包含 4 个部分:前面得 2 就是对象序号,其用来唯一标记一个对象;0 就是生成号,根据 PDF 法律规范,假如一个 PDF 文件被修改,那这个数字就是累加得,它与对象序号一起标记就是原始对象还就是修改后得对象,但就是实际开发中,很少有用这种方式修改 PDF 得,都就是重新编排对象号;obj 与 endobj 就是对象得定义范围,可以抽象得理解为这就就是一个左括号与右括号;省略号部分就是 PDF 规定得任意合法对象(一共 8 种,见后面附 A)。可以通过 R 关键字来引用任何一个对象,比如要引用上面得对象,可以使用 2 0 R,需要主意得就是,R 关键字不仅可以引用一个已经定义得对象,还可以引用一个并不存在得对象,而且效果就与引用了一个空对象一样。 3、交叉引用表 交叉引用表就是 PDf 文件内部一种特别得文件组织方式,可以很方便得根据对象号随机访问一个对象。其格式如下: xref 0 1 0000000000 65535 f 4 10000000009 00000 n 8 30000000074 00000 n 0000000120 00000 n 0000000179 00000 n 其中,xref 就是开始标志,表示以下为一个交叉引用表得内容;每个...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

PDF文件结构详解

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部