KeyDesignConsiderationsforConsumerCreditRiskDataMart零售信贷风险数据集市设计要点零售信贷风险数据集市设计要点零售信贷风险数据集市设计要点零售信贷风险数据集市设计要点2010.72Copyright©2009ALISolutions™WhatisRiskDataMart?什么是风险数据集市什么是风险数据集市什么是风险数据集市什么是风险数据集市????�风险数据集市是企业数据仓库(EDW)的一个具体应用,其他应用包括交叉销售数据集市等。•问题:建立企业数据仓库是为什么?�风险数据集市里面的数据项主要是汇总型、统计型的数据项。�风险数据集市里面的数据结构主要分为2个类型,服务于4个对象。具体如下:BI工具/Cognos报表BI工具/CognosOLAPCube数据结构决策引擎/VincioStrategySimulationSAS数据挖掘、建模关系型数据结构软件工具软件工具软件工具软件工具服务对象服务对象服务对象服务对象数据结构类型数据结构类型数据结构类型数据结构类型3Copyright©2009ALISolutions™BenefitsofRiskDataMart风险数据集市的好处风险数据集市的好处风险数据集市的好处风险数据集市的好处�及时性•汇总型、统计型数据都在每天晚上batchwindow期间算好了供生产时间随时调用,无需等待;•数据都是最新更新的数据;�共享性•各个部门、系统可以共享里面的汇总型、统计型数据,无需重复计算,浪费资源;•例如:人行征信数据�多维度•可以实时地支持OLAP多维度分析;�可维护性高•数据结构清晰、集中,易于维护、改进,可持续发展;4Copyright©2009ALISolutions™SystemArchitecture系统架构系统架构系统架构系统架构5Copyright©2009ALISolutions™KeyRequirementsforRiskDataMart风险数据集市的需求要点风险数据集市的需求要点风险数据集市的需求要点风险数据集市的需求要点�Mustbecomprehensivetosupportallriskreporting,analyticsanddecisioningneeds;数据必须非常全面,能够支持所有风险相关的报表、数据分析、和决策的需求;�Mustsupportbothbatchaccessandreal-timeaccess(on-demandaccess);必须同时支持批次访问和实时访问(按需访问);�NightlybatchupdatebyunderlyingDWsystem(whichreceivesdailybatchupdatefromoperational/transactionsystemsviaETL);每天晚上由底层数据仓库系统进行批次更新(数据仓库系统每天通过ETL从交易系统/作业系统批次获得新的明细数据);�Read-Onlyaccessbyreporting,analyticsanddecisioningsystems;为报表、数据分析、和决策相关系统提供“只读”访问;�Containsmostlysummary-leveldata(vs.rawdatainunderlyingDW);包含的数据项绝大部分为汇总型数据,而非储存在数据仓库中的原始、明细数据;�ContainsOLAPCubedatasetinadditiontotypicalrelationaldataset;包含Cube格式储存的数据结构(除了通常的关系类型数据结构);�DesignedandownedbyRiskMIS/AnalyticsGroup;由风险决策分析部门设计并主导;�ImplementedandmaintainedbyITGroup;由IT部门负责实施和维护;6Copyright©2009ALISolutions™OverlappingOLAPCubeConcept重叠的重叠的重叠的重叠的OLAPCube概念概念概念概念�SingleCube单个单个单个单个Cube•Supportdiversequeries支持多方位的查询•Toomanydimensions–TooLarge维度太多了–太大了�MultipleCubes多个多个多个多个Cube•Somedimensionsare‘shared’ByALLCubes某些维度被所有Cube共享�CustomerProfileDimensions客户概貌维度•SomedimensionssharedacrossasubsetofCubes某些维度被部分Cube共享�HowtoDecideonCubeDesign如何确定如何确定如何确定如何确定Cube设计设计设计设计•SampleQueries样板查询•RankExpectedUtilization(#ofusers,frequency)按预期利用率排序(用户数,频率)•ExpectManyCubes:10–50通常会设计很多个Cube:10-507Copyright©2009ALISolutions™ListofCommonCubes常见的常见的常见的常见的Cube�CustomerCube客户�ProductCube产品�CreditBureauCube征信局�ApplicationCharacteristics(CouldbepartofCustomerCubeaswell)申请特征变量�MonthlyPerformanceAnalysisCube月度表现分析�Multi-MonthPerformanceCu...