数据挖掘感想 通过学习一个学期的数据挖掘课对数据挖掘有了一定的理解,也掌握了,理解了一些数据挖掘中用到的重要的算法
在这个数据膨胀的大数据时代我们需要筛选,查询数据,处理数据
我们看到的听到的都是数据,在这互联网时代数据更多,信息很多
但是有些网站比如百度,谷歌,雅虎等为我们的学习生活带来了很多便利
我们为了更正确更有效的利用和处理数据必须要利用数据挖掘技术,因为有了这技术我们以后的数字化生活变得更方便,不会因为数据多,信息多而感到反感
所以我真正的体会到了数据挖掘的优越性
同时我学习一些算法过后也感觉到了其复杂性,因为数据挖掘算法众多,掌握起来比较困难
我们主要学习了贝叶斯分类算法,决策树分类算法等算法,这些是比较简单并且利用比较广泛的算法
也学习了数据的概念,数据理解包括收集原始数据、数据描述、数据探索分析和数据质量描述
我们首先收集大量的数据然后对此进行数据描述分类数据,然后优化净化数据,并对此进行分类整理,保存查询,搜索数据等
贝叶斯算法:贝叶斯分类基于贝叶斯定理,贝叶斯定理是由18 世纪概率论和决策论的早起研究者 Thomas Bayes 发明的,故用其名字命名为贝叶斯定理
分类算法的比较研究发现,一种称为朴素贝叶斯分类法的简单贝叶斯分类法可以与决策树和经过挑选的神经网络分类器相媲美
用于大型数据库,贝叶斯分类法也已表现出高准确率和高速度
目前研究较多的贝叶斯分类器主要有四种,分别是:Naive Bayes、TAN、BAN 和GBN
朴素贝叶斯分类是一种十分简单的分类算法,思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类
贝叶斯定理(Bayes' theorem)是概率论中的一个结果,它跟随机变量的条件概率以及边缘概率分布有关
在有些关于概率的解说中,贝叶斯定理能够告知我们如何