调查数据分类与整理的心得体会正如柏拉图所说:需要是发明之母
随着信息时代的步伐不断迈进,大量数据日积月累
我们迫切需要一种工具来满足从数据中发现知识的需求
而数据挖掘便应运而生了
正如书中所说:数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做出贡献
1、数据挖掘数据挖掘应当更正确的命名为
“从数据中挖掘知识”,不过后者显得过长了些
而“挖掘”一词确是生动形象的
人们把数据挖掘视为“数据中的知识发现(kdd)”的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤
由此而产生数据挖掘的定义
从大量数据中挖掘有趣模式和知识的过程
数据源包括数据库、数据仓库、web、其他信息存储库或动态地流入系统的数据
作为知识发现过程,它通常包括数据清理、数据集成、数据变换、模式发现、模式评估和知识表示六个步骤
数据挖掘处理数据之多,挖掘模式之有趣,使用技术之大量,应用范围之广泛都将会是前所未有的;而数据挖掘任务之重也一直并存
这些问题将继续激励数据挖掘的进一步研究与改进
2、数据分析数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用
是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程
数据分析有极广泛的应用范围
典型的数据分析可能包含以下三个步:1、探索性数据分析
当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性
2、模型选定分析,在探索性分析的基础上提出一类或几类第1页共4页可能的模型,然后通过进一步的分析从中挑选一定的模型
3、推断分析
通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断
数据分析的目的是把隐没在一大批看来杂乱无章的数据中