金融行业数据挖掘技术应用论坛 数据挖掘讨论组 朱建秋 zhujianqiu@hotmail.com 一、一、 简介“金融行业数据挖掘技术应用论坛”由中国电子信息产业发展研究院(CCID)和其旗下赛迪集团战略数据资源管理中心主办,北京赛迪数据有限公司负责具体承办, 2002 年 11 月25 日在北京新世纪饭店召开。二、二、 会议纪要1. 1. 会议内容 1)1) 数据挖掘技术与金融分析 内容 数据仓库结构与技术 数据挖掘技术 评分系统在金融决策中的应用 数据挖掘用于评分系统主要观点:(1)(1) 数据仓库是适合知识发现的过程的结构。数据仓库的处理过程是从“数据清理/整合——>数据仓库——>数据选择——>数据挖掘——>模式评价——>知识”不断循环的过程(注:类似 Fayyad 96 年提出的数据挖掘过程模型)。(2)(2) 将数据仓库和挖掘的结构划分为四个层次:第一层是数据层,第二层是多维数据库层 MDDB,第三层是 OLAP 和 OLAM,第四层是用户界面。(注:类似 Han Jiawei 的 OLAM 体系结构)(3)(3) 数据挖掘过程包括:数据选择,数据转换,数据挖掘,数据解释。(4)(4) 数据挖掘的方法:联想,划分,聚类,预测,顺序模式,相似时间序列。(5)(5) 数据挖掘的科学方法数学工具:统计学,决策树,神经网络,模糊逻辑,线性规划。(6)(6) 个人信用评分系统是将个人信用的历史(六个月以上)经过 45至 65 个因素的刻划后表述的决策模型。通常个人信用评分为 350 至 850 之间。每人从 850 分起,有坏帐记录,即扣去不同比例的分数。经过评分模型的分析,最后得到决策评分。(850 为最好)(7)(7) 评分因素:过去的付帐历史、信用欠帐量、信用卡使用时间、新信用卡的申请、信用卡的类、信用卡交易情况、现金提取情况(8)(8) 应用前景:银行各类信贷风险分析,企业和个人信用风险分析 2)2) 如何利用数据挖掘工具协助进行市场营销 内容 数据挖掘的定义 IBM 数据挖掘的解决方案 在金融行业的应用主要观点:(1)(1) 强调了数据挖掘过程,首先必须明确需要解决的商业问题。(2)(2) IBM 有从数据库到最上层的挖掘工具的一整套商业智能解决方案。(3)(3) 在银行应用的层次:信用评分,购物篮分析,区隔分析,交叉营销/向上营销,客户流失,客户价值。(4)(4) 讲解了 Lift Chart 图的含义 3)3) 数据挖掘在金融行业的应用趋势分析 内容 数据管...