基于多媒体的数据挖掘【摘要】:多媒体挖掘是数据挖掘的一个新兴且富有挑战性的子领域
本文介绍了多媒体数据挖掘的特性,一种适合多媒体挖掘的系统模型,阐述了几种多媒体挖掘方法以及讨论了多媒体数据挖掘在知识服务中的应用
【关键词】:数据挖掘,多媒体挖掘,挖掘方法,服务应用目前,数据挖掘是数据库研究、开发和应用最活跃的分支之一,也是人们一直研究的热点
在数据挖掘近年来研究与应用迅猛发展的过程中,前人取得了一定的成果[1]
新的和改进的算法不断出现,所考察的数据类型日趋丰富,应用领域逐渐扩大,数据挖掘技术正慢慢融入到多媒体数据库中
多媒体数据库因为其数据量大、数据结构复杂、模式多样等特点一直是人们研究的难点
随着数据挖掘技术应用的成功,人们将目光放到了多媒体数据库中进行知识发现
一、数据挖掘的概念及其结构1、基本概念简单地说,数据挖掘是从大量数据中提取或挖掘知识
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程
与数据挖掘相近的同义词有数据融合、数据分析和决策支持等
这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题
数据挖掘是从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤
2、体系结构一个典型的数据挖掘系统的体系结构如下:其中数据库、数据仓库或者是其他一些信息存储媒介为数据挖掘的工作对象;服务器主要是响应数据挖掘引擎的请求,提取相应的数据;领域知识库主要用来指导挖掘的过程,以及用来评价挖掘出来的候选模式;数据挖掘引擎是整个系统的核心部分,可以由以下模块组成:分类模块、关联规则模块、聚类分析模块、时序模块和异常分析模块等;模式评价模块主要是根据一