多源信息融合软件的设计与实现多源信息融合软件的设计与实现 摘 要:针对多源信息类型不一致影响信息利用效率的问题,文章在分析传统多源数据融合模型的基础上,讨论了多源信息融合软件的架构及相关技术,设计并开发的软件具有较高的有用价值。 关键词:多源信息;信息融合;软件开发 多源信息融合是经过将多种信源在空间上和时间上的互补与冗余信息依据某种优化准则组合起来,产生对特点对象的一致性解释与描述。数据融合技术是指利用计算机对获得的信息,在一定准则下加以自动分析、综合,以完成所需决策和评估任务而进行的信息处理技术。主要包括对各类信息源给出有用信息的采集、传输、综合、过滤、相关及合成,以便辅助人们进行态势/环境判定、规划、探测、验证。 数据格式统一是进行数据处理的前提。由于信息的来源多,数据格式类别差异较大,对于数据处理带来不便。多源信息融合软件能够实现多源异构数据信息整合,对于充分利用信息资源、提高数据处理系统性能具有有用价值。 1 多源数据融合模型 根据对输入信息的抽象或融合输出结果的不同,能够将信息融合分为不同的 3 级,包括数据级融合、特征级融合及决策级融合。 作为数据级的多源数据融合模型的结构如图 1 所示。多源数据经过数据清理、数据集成、数据变换,形成有效数据,经过数据处理形成数据挖掘分析等处理工作的有效数据。 数据清理是指去除源数据集中的噪声数据和无关数据,处理遗留数据和清洗脏数据,去除数据域的知识背景上的白噪声,考虑时间顺序和数据变化等。主要包括处理噪声数据,处理空值,纠正不一致数据等。 数据集成就是将多文件或多数据库运行环境中的异构数据进行合并处理,将多个数据源中的数据结合起来存放在一个一致的数据存储中。 数据变换就是将数据变换成统一的适合处理的形式。数据变换主要包括平滑、聚集、属性构造、数据泛化和法律规范化等内容。 2 多源信息融合软件设计 2.1 软件架构 多源信息融合软件的技术要求是实现多源异构数据向指定关系数据库进行可靠转换。就是根据指定关系数据库的表结构要求,实现多源异构数据的数据导入及格式转换问题。软件的组成框图如图 2 所示。软件主要包括 2 个主要模块,多源数据预处理模块和数据导入模块。数据预处理模块主要进行数据清理及格式转换,实现常见的数据(txt、xls、关系数据库等数据)转换为目标数据库支持的数据格式。数据导入实现指定类型数据转换为指定结构数据。 2.2 关...