1银行客户数据分析2007-09-012背景数据客户群服务盈利•商业银行拥有大量的个人客户交易数据、个人客户服务数据和个人客户基本资料数据
在这些海量数据中,隐藏着大量的有价值的客户信息
运用数据挖掘中的聚类分析技术可以从这些数据集中提取客户的分类知识
聚类分析技术可以将性质、特征近似的数据对象归属在相同的群集中
商业银行可以利用此技术分辨出能有效为之服务的最有价值的客户,为他们提供更为个性化的服务,从而影响相关的客户行为并最终达到提高盈利的目的
3数据集•客户数据集包含10,000条客户数据•包含有31个特征(属性),分别为:•BankNo(银行代码,其值有:004,024,077等)•Accountnum(账户代码)•ShortName(客户名字)•FirstContactDate(第一次接触日期)•accountopendate(账户开户日期)•accountbalance(账户当前余额)•accountlowbalance(账户曾经最低余额)•accounthighbalance(账户曾经最高余额)•balancecategory(余额类型)•StatementLowBalance(最低交易账目,有正有负)4数据集(属性)•StatementHighBalance(最高交易账目)•StatementAggregateDebitBalance(聚集透支账目)•StatementAggregateDebitDay(透支账目的天数)•StatementAggregateCreditBalance(聚集存款账目)•StatementAggregateCreditDay(存款账目的开数)•ReturnCheckCount(退回支票的次数)•Status(客户状态)•AuditGranding(授权级别,越高则风险越低)•SalaryBeforeLastMonth(上一