基于因式分解机的信用预测中数据压缩和补齐方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

企业和个人信用预测在金融贷款领域具有重要的意义，通过信用预测模型判断借贷方信用类别，决定是否对其进行贷款，可以在很大程度上降低银行等信贷部门的贷款风险。小微企业是中国企业的重要组成部分，然而小微企业普遍存在贷款难题。随着互联网的高速发展，小微企业在网络上的信息越来越多，利用互联网数据预测小微企业的信用，将会给小微企业信用贷款带来启发。由于互联网信用数据的特征之间具有一定的关联，因式分解机处理这种关联数据具有一定的优势，因此本文将研究因式分解机在信用预测方面的应用。由于信用数据存在缺失和重复的问题，采用一定的方法去掉重复数据将会加快信用预测的效率，同时对缺失值进行补齐将有助于提高信用预测的质量。本文的主要研究工作如下：（1）研究因式分解机模型Factorization Machine在信用预测方面的应用。本文对因式分解机进行了深入的研究，分析其原理和优势，并将其应用在信用预测方面。本文在四个信用数据集上进行信用预测实验，并与常用的分类算法对比。实验结果表明，因式分解机在多个分类评价指标上的性能表现良好，比较适用于信用数据集。（2）针对信用数据中存在重复数据的问题，提出基于Block Structure（BS）和Hash Learning的算法STH-ML，主要用于生成BS所依赖的映射文件，达到压缩数据集规模的目的。信用数据是关联数据，会在某种程度上造成数据重复的情况。因式分解机提出了利用BS避免数据重复的问题，从而压缩数据规模。然而目前在生成BS所依赖的映射文件这一关键步骤上缺乏有效的方法，本文在Self-Taught Hashing（STH）算法的基础上进行改进，提出基于BS的映射文件生成算法STH-ML。实验结果表明，STH-ML相比于STH性能最高提升了6.78%。（3）针对信用数据缺失的问题，提出了基于标签的多角度融合的数据补齐算法。本文所使用的部分信用数据存在数据缺失的情况，通常这些缺失数据仍然具有一定的研究价值，对其进行补齐有利于提高信用预测的质量。本文利用已有的样本信用标签，借鉴推荐系统领域协同过滤的思想，提出了基于标签的多角度融合的数据补齐算法LMVFM。实验结果表明LMVFM相比于经典的数据补齐算法，数据补齐的误差最高降低了4.13%，可以较好的适用于企业和个人信用数据集。

著录项

作者
朱阁;
展开▼
作者单位

武汉理工大学;

展开▼
授予单位武汉理工大学;
学科软件工程
授予学位硕士
导师姓名李琳;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类石油机械设备与自动化;
关键词
分解机; 信用; 预测; 数据压缩;

相似文献

中文文献
外文文献
专利

1. 基于信用评分和数据挖掘对商业贷款违约情况的预测方法研究 [J] . 聂纪予 . 全国商情·理论研究 . 2020,第004期
2. 基于信用评分和数据挖掘对商业贷款违约情况的预测方法研究 [J] . 聂纪予 . 全国流通经济 . 2020,第004期
3. 基于混合算法的通信用户规模预测方法研究 [J] . 司秀丽 ,刘子琦 . 计算机工程与科学 . 2017,第003期
4. 基于网格搜索支持向量机的个人信用等级评分预测 [J] . 蒲峥屹 ,李云飞 . 市场研究 . 2020,第003期
5. 基于时间序列支持向量机的信用额度预测 [J] . 屈新怀 ,马文强 ,丁必荣 . 合肥工业大学学报（自然科学版） . 2020,第010期
6. 基于手机出货量的4G手机通信用户预测分析 [C] . 李双杰 ,谭振龙 . 中国移动通信集团设计院第19届新技术论坛 . 2013
7. 基于非负矩阵因式分解的疾病关联miRNA预测方法研究 [A] . 黄焱 . 2015

基于因式分解机的信用预测中数据压缩和补齐方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅