机器学习的定义从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法
但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法
机器学习的范围其实,机器学习跟模式识别,统计学习,数据挖掘,计算机视觉,语音识别,自然语言处理等领域有着很深的联系
从范围上来说,机器学习跟模式识别,统计学习,数据挖掘是类似的,同时,机器学习与其他领域的处理技术的结合,形成了计算机视觉、语音识别、自然语言处理等交叉学科
因此,一般说数据挖掘时,可以等同于说机器学习
同时,我们平常所说的机器学习应用,应该是通用的,不仅仅模式识别模式识别=机器学习
两者的主要区别在于前者是从工业界发展起来的概念,后者则主要源自计算机学科
在著名的《PatternRecognitionAndMachineLearning》这本书中,ChristopherM
Bishop 在开头是这样说的"模式识别源自工业界,而机器学习来自于计算机学科
不过,它们中的活动可以被视为同一个领域的两个方面,同时在过去的 10 年间,它们都有了长足的发展”
数据挖掘数据挖掘=机器学习+数据库
这几年数据挖掘的概念实在是太耳熟能详
几乎等同于炒作
但凡说数据挖掘都会吹嘘数据挖掘如何如何,例如从数据中挖出金子,以及将废弃的数据转化为价值等等
但是,我尽管可能会挖出金子,但我也可能挖的是“石头”啊
这个说法的意思是,数据挖掘仅仅是一种思考方式,告诉我们应该尝试从数据中挖掘出知识,但不是每个数据都能挖掘出金子的,所以不要神话它
一个系统绝对不会因为上了一个数据挖掘模块就变得无所不能(这是IBM 最喜欢吹嘘的),恰恰相反,一个拥有数据挖掘思维的人员才是关键,而且他还必须对数据有深刻的认识,这样才可能从数据中导出模式指引业务的改善
大部分数据挖掘中的算法是机器学习的算法在数据库中的优化