©2011MERIT
AllRightsReserved
MERIT&itslogo,aretrademarksofMERIT
智慧数据财富未来电力行业数据挖掘应用西安美林数据挖掘研究中心智慧数据财富未来2目录第一章数据挖掘基础知识第二章电力行业应用案例第三章数据挖掘咨询过程智慧数据财富未来3数据挖掘定义数据挖掘(DataMining,简称:DM):是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程
是知识发现(Knowledge-DiscoveryinDatabases,简称:KDD)中的一个重要步骤
广泛应用:需要是发明之母
近年来,数据挖掘技术在信息产业界得到了高度的重视和广泛的应用,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识
获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等
智慧数据财富未来4数据挖掘基本原理数学模型过热放电…运行状态地域因素…电气参数数据建模基于物理定律、化学公式等基本理论建立工程问题的数学模型——如:万有引力定律,卡门-钱定律等
机理模型从数据中发现变量之间的函数关系、规则、模式等
基本原理:把研究对象作为黑箱,仅研究输入-输出关系(反映系统论的观点)
数据挖掘模型参考定性原理、经验,基于数据建立数学模型机理不明确无法建立数学公式油气含量环境因素智慧数据财富未来5数据挖掘解决问题的思路数据挖掘在解决实际问题时经常会把数据拆分为两个数据集:训练数据集、测试数据集
通过数据挖掘算法对训练数据集进行建模,寻找X和Y之间的数学模型,然后通过测试数据集来验证该数学模型的准确率,如果误差能够达控制到一定精度,则认为该模型很好的反映了X和Y的关系,可以用来进行预测和分析
数据挖掘算法建模线性回归神