摘要基于当今这个高度信息化的时代,数据挖掘技术及数据仓库的高速发展,通过网络平台交流的用户日趋增加,客户分类就成为了当今社会首要解决的问题
本论文在数据挖掘的理论、方法及技术上,以决策树为建模主要思想,采用决策树中的基于指数的分类和回归树()算法,把新浪微博客户信息转化为属性结论式的形式,通过构建树、修剪树、评估模型三步骤,将客户进行分类,从而快速准确地区分目标客户及非目标客户
在数据挖掘技术模型的基础上,将新浪微博的目标客户模型做部分的调整,最终能够得到最优化模型
该模型有着响应时间较短且精度高的特点,若运用到实际生活中能够大大地提升客户分类的效率,那么无论是企业还是个人都将从中受益良多
关键词:决策树;目标客户;;新浪微博;数据挖掘,
:;;;;目录一、前言由于通讯技术迅猛发展,中国网络发生了根本性地改变,与国外相比,国内的交流平台面对着一个全新的,全球化的,竞争更加激烈的市场环境
在这样一个商业时代,资源占有率成为一个企业生死存亡的关键点,客户才是企业生存与发展的根本,而对于如何改善客户服务,增加客户满意度和忠诚度,提升客户价值来扩大自身的收入和利润,如何用信息化管理来替代原有的传统管理手段等方法,是新浪门户当前解决的重要问题之一
因此,企业必须从“产品”导向向“客户”导向转变,从而对客户进行有效管理,深层分析存储大量客户信息的数据仓库,提高企业市场竞争力,获得有利于商业运作,有效信息从而创造更多的价值
而当前的数据库技术虽可以对数据高效查询、分析及统计,但是仍无法发现潜在的规律和联系,因此便无法对未来发展的趋势进行更好地预测,导致了一种“数据膨胀但是知识贫乏”的现象[],这样的需求便使数据挖掘这门技术孕育而生
数据挖掘技术是从先前不知的、大量的、模糊的、不完整的随机的数据中提取潜在的有用的知识及信息的一个过程
正是有了这种技术