下载后可任意编辑互联网金融时代下机器学习与大数据风控系统随着互联网的进展,互联网金融已成为当前最热门的话题,包括支付、理财、众筹、消费等功能在内的各类互联网金融产品和平台如雨后春笋般涌现。互联网金融是传统金融行业与互联网精神相结合的新兴领域,是对传统金融行业的有效补充,因此互联网金融的健康进展应遵循金融业的基本规律和内在要求,核心仍是风险控制。 传统金融的风险控制,主要是基于央行的征信数据及银行体系内的生态数据依靠人工审核完成。在国内的征信服务远远不够完善的情况下,互联网金额风险控制的真正核心在于可以依靠互联网猎取的大数据,如 BAT 等公司拥有大量的用户信息,这些数据可以用来更加全面的预测小额贷款的风险。而机器学习将是大数据时代互联网金融企业构建自动化风控系统的利器。 1. 什么是机器学习? 机器学习这个词信任大家都是耳熟能详,尤其是近几年机器学习界的执牛耳者与互联网界的大鳄的联姻(见图 1),更加推动了大众对机器学习的追求热情和在互联网行业中应用的探究热情。 那 么 , 什 么 是 机 器 学 习 呢 ? 机 器 学 习 这 个 词 是 英 文 名 称 Machine Learning 的直译,从字面意义不难知道,这门技术是让计算机具有 “自主学习” 的能力,因此她是人工智能的一个分支。我个人还是比较喜爱 Tom Mitchell 在《Machine Learning》一书中对其的定义: "A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E." 关于机器学习的具体概念及介绍,有很多这方面的资料,有兴趣的话大家下载后可任意编辑可以去查看,在这里我就不赘述。简而言之,机器学习方法就是计算机利用已有的数据(经验),得出某种模型,并利用模型来预测未来的一种方法,这种方法很类似于人类的思考方式(见图 2)。也就是说,机器学习的一个主要目的就是把人类思考归纳经验的过程转化为计算机对数据的处理计算得出模型的过程。 机器学习与人类思考的对比 2. 机器学习算法的类型 一般来说,机器学习算法可以分为监督学习,无监督学习,半监督学习,强化学习(Reinforcement learning)以及推举这几大类。各部分常见应用场景和算法详见图 3。 下载后可任意编辑 图 3:机器学习算法分类 3....