第1页共11页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共11页epub格式电子书遵循IDPF推出的OCF规范,OCF规范遵循ZIP压缩技术,即epub电子书本身就是一个ZIP文件,我们将epub格式电子书的后缀.epub修改为.zip后,可以通过解压缩软件(例如winrar、winzip)进行浏览或解压处理。一个未经加密处理的epub电子书以三个部分组成,其文件结构如下图所示:1、文件:mimetype每一本epub电子书均包含一个名为mimetype的文件,且内容不变,用以说明epub的文件格式。文件内容如下:application/epub+zip//注释,表示可以用epub工具和ZIP工具打开2、目录:META-INF依据OCF规范,META-INF用于存放容器信息,默认情况下(即加密处理),该目录包含一个文件,即container.xml,文件内容如下:container.xml的主要功能用于告诉阅读器,电子书的根文件(rootfile)的路径(红色部分)和打开放式,一般来讲,该container.xml文件也不需要作任何修改,除非你改变了根文件的路径和文件名称。除container.xml文件之外,OCF还规定了以下几个文件:(1)[manifest.xml],文件列表(2)[metadata.xml],元数据(3)[signatures.xml],数字签名(4)[encryption.xml],加密(5)[rights.xml],权限管理对于epub电子书而言,这些文件都是可选的。3、目录:OEBPSOEBPS目录用于存放OPS文档、OPF文档、CSS文档、NCX文档,如果是制作中文电子书,则还包括ttf文档(即字体文档),OEBPS目录也可以建立相应的子目录,例如建立chapter目录,把各章节的OPS文档放在chapter目录之中。下图一本epub电子书OEBPS文档的实例图:第3页共11页第2页共11页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第3页共11页其中content.opf文件和toc.ncx文件为必需,其它文件可根据电子书的具体情况而定。content.opf文件见博文OPF剖析toc.ncx文件见博文toc.ncx剖析OPF文档是epub电子书的核心文件,且是一个标准的XML文件,依据OPF规范,主要由五个部分组成:1、,元数据信息,由两个子元素组成:,其元素构成采用dublinecore(DC)的15项核心元素,包括:第4页共11页第3页共11页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第4页共11页:题名:责任者:主题词或关键词:内容描述:贡献者或其它次要责任者:日期:类型:格式:标识符:来源:语种:相关信息:履盖范围:权限描述,即扩展元素。如果有些信息在上述元素中无法描述,则在此元素中进行扩展。2、,文件列表,由于列出OEBPS文档及相关的文档,有一个子元素构成,,该元素由三个属性构成:id:表示文件的ID号href:文件的相对路径media-type:文件的媒体类型例如:3、,脊骨,其主要功能是提供书籍的线性阅读次序。由一个子元素构成:第5页共11页第4页共11页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第5页共11页,由一个属性构成:idref:即参照menifest列出的ID例如:4、,指南,依次列出电子书的特定页面,例如封面、目录、序言等,属性值指向文件保存地址。一般情况下,epub电子书可以不用该元素。5、,导读。可以根据不同的读者水平或者阅读目的,按一定次序,选择电子书中的部分页面组成导读。一般情况下,epub电子书可以不...