第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第1页共6页基于多媒体的数据挖掘【摘要】:多媒体挖掘是数据挖掘的一个新兴且富有挑战性的子领域。本文介绍了多媒体数据挖掘的特性,一种适合多媒体挖掘的系统模型,阐述了几种多媒体挖掘方法以及讨论了多媒体数据挖掘在知识服务中的应用。【关键词】:数据挖掘,多媒体挖掘,挖掘方法,服务应用目前,数据挖掘是数据库研究、开发和应用最活跃的分支之一,也是人们一直研究的热点。在数据挖掘近年来研究与应用迅猛发展的过程中,前人取得了一定的成果[1]。新的和改进的算法不断出现,所考察的数据类型日趋丰富,应用领域逐渐扩大,数据挖掘技术正慢慢融入到多媒体数据库中。多媒体数据库因为其数据量大、数据结构复杂、模式多样等特点一直是人们研究的难点。随着数据挖掘技术应用的成功,人们将目光放到了多媒体数据库中进行知识发现。一、数据挖掘的概念及其结构1、基本概念简单地说,数据挖掘是从大量数据中提取或挖掘知识。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。数据挖掘是从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。2、体系结构一个典型的数据挖掘系统的体系结构如下:其中数据库、数据仓库或者是其他一些信息存储媒介为数据挖掘的工作对象;服务器主要是响应数据挖掘引擎的请求,提取相应的数据;领域知识库主要用来指导挖掘的过程,以及用来评价挖掘出来的候选模式;数据挖掘引擎是整个系统的核心部分,可以由以下模块组成:分类模块、关联规则模块、聚类分析模块、时序模块和异常分析模块等;模式评价模块主要是根据一定的度量标准来与数据挖掘模块交互,以使得数据挖掘向着我们感兴趣的方向进行,往往越是高效的数据挖掘系统这种交互影响的程度越高;图形用户界面主要是为方便用户与数据挖掘系统的交互,由用户提出挖掘任务、指定重要的挖掘参数以及由当前返回的结果指导进行更进一步的挖掘工作。第2页共6页第1页共6页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第2页共6页二、多媒体与数据挖掘相结合随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已满足不了应用的需要,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴涵于其中的有价值的知识。这种将数据挖掘技术和多媒体信息处理技术有机地结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘。1、多媒体数据挖掘的特性由于音频视频设备、数码像机、CD-ROM和因特网的流行和普及,多媒体数据库系统变得日益普通。多媒体数据通常是一种多维的、非结构化或者半结构化的,各媒体数据有着不同的特点,有着各自表述信息的方式,各媒体既可独立表示信息又可共同表示相同事件的不同特征,共同描述事件的存在、发展和结果。因此,多媒体数据集中必定存在关于信息主体的特征、属性以及它们之间的关系,或者存在着某些人们从直观上无法得到的模式。多媒体数据挖掘是一种智能的数据分析,旨在从特定的多媒体数据集中发现必要的结果来用于决策、对策及融合分析。例如在MMMiner(MultiMediaMiner,多媒体挖掘)中,如查找包含人脸的所有图像,用户界面上就会逐步显示不同国家、不同肤色、不同表情的人脸,而不是显示一些猴脸或者是马脸。由此可见,多媒体挖掘就是从大量的多媒体数据集中,通过综合分析视听特性和语义,发现隐含的、有效的、有价值的、可理解的模式,得出事件的趋向和关联,为用户提供问题求解层次的决策支持能力。[2]2、多媒体数据挖掘的系统模型多媒体挖掘需要一个切实可行的系统框架模型。它的一般系统结构模型如图:第3页共6页第2页...