二、大数据平台建设(一)大数据平台框架概述 大数据平台建设充足整合信息化资源,打破行业、部门之间信息壁垒,利用大数据技术进行采集、加工、建模、分析,将数据价值融入到金融之中,从而提升创新能力和产品服务能力。关键包含以下三部分:1.大数据分析基础平台 根据功效划分数据区,设计数据模型,在统一步骤调度下,整合各类数据,同现有企业级数据仓库和历史数据存放系统一起,形成基础数据体系,提供支撑经营管理各类数据应用,支撑上层应用。2.大数据应用系统 基于基础数据平台,连续建设各类数据应用系统,经过数据挖掘、计量分析和机器学习等手段,对丰富大数据资源进行开发使用,并将数据决议化过程结合到风控、营销、营运等经营管理活动,充足发挥大数据价值。3.大数据管控 建立数据标准,提升数据质量,加强元数据管理能力,为平台建设及安全提供保障(二)大数据平台建设标准 大数据平台是大数据利用基础实施,其设计、建设和系统实现过程中,应遵照以下指导标准: 经济性:基于现有场景分析,对数据量进行合理评定,确定大数据平台规模,后续依据实际情况再逐步优化扩容。可扩展性:架构设计和功效划分模块化,考虑各接口开放性、可扩展性,便于系统快速扩展和维护,便于第三方系统快速接入。 可靠性:系统实行系统结构、技术方法、开发手段全部应建立在已经相当成熟应用基础上,在技术服务和维护响应上同用户主动配合,确保系统可靠;对数据指标要确保完整性,正确性。 安全性:针对系统级、应用级、网络级,均提供合理安全手段和方法,为系统提供全方位安全实施方案,确保企业内部信息安全。大数据技术必需自主可控。 优异性:涵盖结构化,半结构化和非结构化数据存放和分析特点。借鉴互联网大数据存放及分析实践,使平台含有良好优异性和弹性。支撑目前及未来数据应用需求,引入对应大数据相关技术。 平台性:归纳整理大数据需求,形成统一大数据存放服务和大数据分析服务。利用多租户, 实现计算负荷和数据访问负荷隔离。多集群统一管理。 分层解耦:大数据平台提供开放、标准接口,实现和各应用产品无缝对接(三)基础数据起源 1.银行内部大数据资源 用户本身信息和其金融交易行为,依据现在积累沉淀数量资源情况,将数据关键分为三大类: 第一类:用户基础数据 用户信息数据,即用户基础数据,关键是指描述用户本身特点数据。 个人用户信息数据包含:个人姓名、性别、年纪、身份信息、联络方法、职业、生...