下载后可任意编辑用 XSLT 和 Xpath 查询 XML 文档1下载后可任意编辑 1.序言 1.1 XML 概述1.1.1 XML 产生背景 当今,互联网已渗透到社会生活的每一个角落,在此过程中 HTML—超文本标记语言功不可磨,HTML 以其简单精练的语句和易于掌握的通用性和易学性,使 web 技术从计算机世界走向全社会,走向千家万户。然而由于电子商务,电子图书,远程教育等的异军突起,使传统的 web 资源更加复杂化,多样化,于是高容量,高信息量,高效率成为网络信息技术进展追求的目标,与此同时,人们对 web 服务功能的需求也达到了更高的标准,如:用户需要对 web 进行智能化的语义搜索,对数据按不同的需求进行多样化显示等个性化服务;公司和企业要为客户创建和分发大量有价值的文档信息,以降低生产成本;以及对不同平台,不同格式的数据源进行数据集成和转换等等。因此,面对着 web 技术的飞速进展,HTML 存在着如下的不足: ·HTML 的标记集合是固定的。随着 web 技术的进展,新的数据格式不断出现并且需要在网上展现,这就需要有一种比较灵活的标记机制来满足不断进展的 web 内容要求,但标准的 HTML 语法格式过于简单,且又不允许用户自己创建新的标记,这将无法支持那些专门的页面格式,如:数学公式,化学方程式,音乐乐谱等。·DHTML 的问题。由于标准的 HTML 已经无法满足用户的需求,人们在其基础上增加了动态的成分,如脚本程序等,但是这些非标准的技术制作的网页在不同的浏览器之见互不兼容。·HTML 只是一种表现技术,它并不能揭示 HTML 标签所标记的信息的任何含义。·随着 web 文件变得越来越大,越来越复杂,web 内容提供商已开始感受到普通的 HTML 已经无法提供用于大规模商业出版所需的扩展性,结构化和数据检查功能。1.1.2 XML 简介 1996 年 7 月 W3C 开始设计 XML,1998 年 2 月发布了 XML1.0 的第一个版本。XML 是 SGML 的一个简化子集,保留了 SGML80%的功能,而其复杂程度只有原来的 20%。XML 将 SGML 的灵活性和强大功能与 HTML 的易用性结合到web 的应用中,以一种开放的自我描述的方式定义了数据结构,在描述数据内容的同时能突出对结构的描述,从而体现数据之间的关系。 与普通的标记语言不同,XML 是一种元标记语言,即它是一种用来定义标记语言的标记语言。事实上,用户可以利用 XML 语法和有限的元标记,来定义自己需要的任意的特别标记集,即定义一种...