企业信息化下的 XML 与数据集成企业信息化下的 XML 与数据集成 摘 要:讨论实现基于 XML 的数据集成技术,探讨 XML 的主要技术以及 XML 应用。XML 是 eXtensible Markup Language(可扩展的标记语言)的缩写,标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。并从 XML主要技术、XML 应用来阐述。同时 XML 应用从支持数据交换、在异构数据库集成中的关键技术作用、存储数据、支持以文档为中心和以数据为中心的应用、定义新的标记语言。 关键词:XML;数据集成;数据交换 中图分类号:F270 文献标志码:A 文章编号:1673-291X(2025)03-0015-02 一、XML 概述 XML 是 eXtensible Markup Language(可扩展的标记语言)的缩写,标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如 HTML,也可以使用像 XML 这样由相关人士自由决定的标记语言,这就是语言的可扩展性。用 XML 作为中介格式,就不再需要知道对方内部的资料存储格式,某个系统内部的变更,也不再会涉及和它往来的其他系统。因此,XML 成为定义一种互联网上交换数据的标准。XML 为大家提供了理想的缓冲,并逐步成为 Internet 上数据表示和交换的标准。 1.XML 与 HTML 。HTML 作为标记的集合并不能揭示标记中内容的含义,在 XML 文档中能够清楚地反映数据内容和数据结构之间的关系(如图 1 所示)。XML 实际上是一种定义语言,即使用者可以定义无穷无尽的标记来描述文件中的任何数据元素,从而突破了 HTML固定标记集合的约束,使文件的内容更丰富更复杂并组成一个完整的信息体系,在 WEB 上有着很旺盛的生命力。 XML 在使用上,很多地方还离不开 HTML 的帮助。只是在 HTML 标准中可能不会再增加新的功能,对新功能的支持可能都会放在XML 标准中。 设计 XML 的目的不是取代 HTML,而是与 HTML 合作以扩展网站网页的功能。如传输任意形式的文件、以尽可能合理的方式来排序、筛选、重组、搜寻以及管理信息、使信息呈现出高度的结构化。 目前 XML 的最大的不足在于所有的执行细节还是没有完全制订出来,语法格式还有可能再变动。 2.XML 主要技术。W3C 最近发布处理的一个就是关于 Web Services 的讨论和 XML 的更新机制。其中关于 XML 有三个关键要素:Schema(模式)...