汕头大学学报(自然科学版)

2023, v.38;No.118(03) 13-24

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于多模型融合Stacking集成学习保险欺诈预测
Learning Insurance Fraud Prediction Based on Multi-Model Fusion Stacking Integration

缪智伟,韦才敏

摘要(Abstract):

本文结合人工智能的前沿理论研究,提出一种基于改进XGBoost与LightGBM模型融合的Stacking集成学习方式的保险欺诈行为预测模型.该模型对保险公司被保人保险欺诈行为的识别具有启示意义,有助于保险公司更好地识别被保人的骗保行为,强化自身风控体系.首先对XGBoost与LightGBM进行Stacking模型融合生成两个新特征,新生成的两个特征和原有的40个特征合并作为第二层Stacking训练模型的输入.其次,在Stacking的第二层中分别选择使用多种分类学习模型,包括Bagging、LightGBM、XGBoost以及传统机器分类模型,包括逻辑回归、高斯贝叶斯、决策树等,各模型的训练和参数均由K折交叉验证和遗传算法优化得到.算例数据来源于阿里云天池挑战赛公开的保险欺诈数据集,对构建多模型融合的Stacking模型预测性能进行了验证与测试.预测结果表明,与传统机器分类模型预测结果相比,基于XGBoost与LightGBM Stacking模型融合集成学习模型对保险欺诈行为具有较高的识别能力.最后,根据计算并可视化出最优分类模型不同特征的重要性结果,得出结论:被保人的职业、发生保险事故的城市、发生保险事故的地区、资本收益、资本亏损是识别保险欺诈行为的重要特征.

关键词(KeyWords): 保险欺诈预测;XGBoost;LightGBM;Stacking模型融合;特征重要性;遗传算法

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 缪智伟,韦才敏

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享