CART 算法对航空公司客户流失的应用 为了降低客户的流失造成公司的巨大损失,构建了客户流失模型。通过航空公司的客户信息、数据预处理、属性规约、数据离散化以及样本选取构建数据集,并利用 CART 算法进行客户流失的预测,利用混淆矩阵和 ROC 曲线评估模型的性能,证明该模型的可行性和良好性,为航空公司开展持续改进的营销活动提供参考。 客户流失;分类预测;混淆矩阵;ROC 曲线;CART 算法 1 引言 随着大数据时代的到来,航空公司掌握隐藏在数据的有价值信息成为猎取商机的关键因素,客户流失是造成公司利润损失的重要原因。客户与公司保持的关系越良好,带给公司的利润就越高。但是不少客户成为新客户的同时,又有一大批的客户流失,一个老客户的关系维护比猎取一个新客户的成本更小[1]。这就需要预测的方法,如何在客户即将流失前有效地发现,并对客户特征进行准确的分析,从而帮助营销部门确定可能流失的目标客户群体,制定有针对性的策略是关注重点。基于决策树建立航空公司客户流失模型,将具有不同特征的客户划分为不同客户类型,分析不同客户群体特征,为制定营销策略提供参考。 2 准备工作 2.1 客户流失类型 由于不同的业务所对应的客户流失的定义不一,这里对客户流失类型的定义:把客户类型 MEMBER_TYPE 分为三类。第一类:第二年飞行次数和第一年飞行次数的比例大于或者等于 90%的客户为未流失客户,标记为 0;第二类:第二年飞行次数和第一年飞行次数的比例大于或者等于 50%小于 90%的客户为准流失客户,标记为 1;第三类:第二年飞行次数和第一年飞行次数的比例小于 50%的客户为已流失客户,标记为 2. 2.2 预测客户流失的重要性 获得新客户,一般需要在销售、市场、广告和人力等方面花费很多,然而大多数新客户白喉产生的利润往往不如流失的老客户。然而,在航空市场竞争日益激烈的今日,航空公司在客户流失方面应该引起自购的重视,如何改善流失问题,进一步提升客户的满意度。忠诚度是航空公司保持自身核心竞争力的一大关键因素。因此,航空公司要做好客户流失预测工作。 2.3CART 决策树 决策树是由内部节点、分支和叶子组成一种树状结构。由根节点开始,叶节点结束。决策树在数据分类和预测中是最简单易懂的数据挖掘方法,同时也是一种非常有效的分类算法。CART 算法可用于分类和回归,相对 ID3 算法和 C4.5 算法应用更加广泛,目前已经成功应用于医学疾病预测[2,3]、鱼种丰富度预测[4...