某保险赔款数据讨论 [摘要]以四川某保险的理赔数据为讨论对象,采纳 SPSS 和Excel 针对赔款金额与费用金额使用了均值分析法,从而获得哪种金额的理赔金额最高;针对险种,赔款金额进行单因素方差分析,根据 p 值得到拒绝方差具有齐次性的原假设,再在数据表中根据 p 值得到拒绝不同险种类别的赔款金额没有显著性差异。根据以上两个结论,能够直观地看出其不同险种的差异,使其进一步改进和完善。 [关键词]理赔数据;数据分析;SPSS 分析 自肺炎疫情暴发以来,保险业的作用得到更多重视[1],但是与此同时还是有很多的群众并不了解其购买的保险好不好,购买的费用与其所理赔的金额是否合理。群众在维护自身利益的同时,也要选择对的保险才能更加放心。在保险行业中,理赔这项工作,既是风险的晴雨表,也是反映保险行业的经营状况的重要依据[2]。本文通过 SPSS 分析对理赔数据进行相关性分析,并通过结论提出建议。 1.分析思路 1.1 分析工具 此讨论里所用到了 SPSS 和 Excel 两种工具,应用 SPSS 软件,有利于方便、快捷地处理统计图形、图表,使过程变得直观、形象[3]。Excel 工具,则是可以进行数据清洗,将重复、多余的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或者删除,最后整理成为标准的、洁净的、连续的数据,提供给数据分析、数据挖掘等使用[4]。 1.2 思路 先通过用 Excel 对数据进行清洗,检测数据是否符合完整性,假如不符合,则要修复数据。假如在数据修复之后依旧存在着与数据完整性约束不一致的情况,则要再次修复数据,直到数据符合要求[5];再通过 SPSS 分析将数据可视化,使用均值分析、单因素方差分析等一系列分析得出结果。 2.数据准备与清洗 2.1 数据准备 理赔数据共 16 列 212182 行,主要包括的是机构、险种、案件号、保单号、赔款金额,赔款时间、费用类型、总保费、保额、客户号、性别、年龄、婚姻状况、过去三年平均收入、职业。其中总保费代表客户第一年投的所有保险费用,保额代表机构赔付的最大限额。 2.2 数据清洗 (1)删去表格中过去三年平均收入为 0、1、4 的行。(2)隐藏无用的数据列,机构、赔款时间、性别、婚姻状况以及职业。(3)将险种进行编号归类,把类型一样的险种分别编号为1、2、3、4、5、6。 3.SPSS 数据分析 3.1 赔款金额与费用金额的均值分析 使用均值分析方法分析因变量赔款金额与自变量费用类型,从而获得那种类型的赔款金额更高。均值分析的步骤:因...