自然杂志30卷1期科技进展遗传进化理论及其在数据挖掘中的应用万旺根①崔滨②ErikD.Goodman③①教授,②博士,上海大学通信与信息工程学院,上海200072;③教授,美国密歇根州立大学电子与计算机工作工程系,兰辛USA48824关键词遗传算法数据挖掘分类规则挖掘关联规则挖掘遗传进化理论由美国密歇根大学J.Holland教授提出.该理论借鉴生物遗传机制
以群体方法进行自适应搜索,受到广泛关注
并在科学研究中得到广泛应用
数据挖掘从大量数据中提取信息与知识
遗传算法具有群体搜索策略和简单的遗传算子
可以实现整个数据空间上的分布式信息搜索和采集
在数据挖掘领域得到广泛应用
本文综述了遗传算法的起源、基本原理和特点
介绍了数据挖掘的应用和发展,阐述了近年来遗传算法在分类规则挖掘和关联规则挖掘方面的应用
最后对遗传算法在数据挖掘中的应用前景和面临的挑战进行了分析和展望
遗传进化理论是模拟达尔文的遗传选择和自然淘汰、适者生存的生物进化过程的计算模型,由美国密歇根大学J.Holland教授于197-5年首先提出
遗传进化理论的核心是遗传算法,该算法是搜索最优解的一种随机化方法,其主要特点是群体搜索策略和群体中个体之间的信息交换方法
遗传进化理论是近20多年来备受关注的一种理论,并在数据挖掘、信号处理、工业设计等领域得到了广泛应用
1遗传算法的起源和特点遗传算法(GeneticAlgorithm)廷一类借鉴生物界的进化规律,即适者生存,优胜劣汰遗传机制而提出的随机化搜索方法[1|
遗传算法最早起源于对人们生物系统进行的计算机模拟研究
构成生物基本单位的细胞中含有一种微小的化合物称之为染色体,生物的所有遗传信息都包含在这个复杂而又微小的染色体中
染色体主要是由一种叫脱氧核糖核酸(DNA)的物质所构成,DNA在染色体中有规律地排列着,形成长长的链状结构,链状结构由于碱基间的氢键连接,所以