首页> 中文学位 >基于特征抽取和分步回归算法的资金流入流出预测模型
【6h】

基于特征抽取和分步回归算法的资金流入流出预测模型

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 资金流入流出问题的国内外研究现状

1.2.2 组合算法的国内外研究现状

1.2.3 因子分解机的国内外研究现状

1.3 关键问题与研究内容

1.4 论文组织结构

第2章 相关技术知识

2.1 基本数据预处理

2.2 特征抽取基本方法

2.2.1 时间角度特征挖掘

2.2.2 用户角度特征挖掘

2.2.3 利率角度特征挖掘

2.3 特征选择策略

2.4 损失函数和优化目标

2.5 模型选择

2.6 本章总结

第3章 特征抽取方法

3.1 数据背景介绍

3.2 特征构建

3.3 特征效果的评价准则

3.4 实验验证与分析

3.5 本章总结

第4章 分步回归算法在资金流预测中的应用

4.1 分布回归算法

4.1.1 单步特征预测

4.1.2 BP神经网络预测

4.2 集成学习方法

4.2.1 梯度提升树法

4.2.2 随机森林方法

4.3 实验结果与分析

4.3.1 实验流程

4.3.2 结果和分析

4.4 本章总结

第5章 因子分解机算法在资金流预测中的应用

5.1 特征稀疏化

5.2 因子分解机求解

5.3 实验结果与分析

5.4 本章总结

第6章 总结与展望

6.1 本文工作总结

6.2 未来工作展望

参考文献

致谢

在读期间发表的学术论文与取得的其他研究成果

展开▼

摘要

商业公司的金融平台往往拥有千万乃至上亿位服务会员,公司的金融业务场景每天必然会涉及大量的资金流入和流出,面对如此庞大的金融数据,资金管理压力会非常大。在既保证资金流动性风险最小,又满足日常业务运转的情况下,精准地预测资金的流入流出情况显得尤为重要。但金融数据的变动往往受社会,政治,经济,重大事件等多方面因素影响,数据趋势不稳定而且包含多噪声,给资金流量的预测带来了困难。本文以金融平台用户的资金流量预测为研究背景,旨在构建一个准确、有效的资金流入流出的预测模型,以最大程度上贴近资金流量的真实值,便于资金管理。本文的主要研究内容与成果如下:
  1.本文针对资金流入流出数据集初始特征不明显的特点,利用特征抽取方法挖掘出相关特征,并采取特征选择策略选出最优特征子集。主要是从时间、用户、利率三个不同角度构造与目标值相关的多个特征,再利用皮埃尔相关系数法进行初步筛选出最为相关的特征。随后用特征选择策略进一步筛选,剔除次相关特征和冗余特征,形成最优特征子集。实验结果表明,特征抽取方法所选的特征子集对不同回归算法的预测效果的影响不同,在最终申购值的12列特征、赎回值的10列特征时达到最佳子集,对大多数不同的回归算法可以得到较好的预测效果。因此可以确定此特征子集作为下一步算法预测的最优特征子集。
  2.为解决数据集不稳定,多噪声的问题,采用分步回归算法对特征子集进行训练学习,提高回归预测准确率。本文提出的是两步特征预测方法,即单步特征预测是运用灰度预测、时间序列算法对未来时间的未知特征进行预测,将预测的特征添加到未来时段的已知特征子集中。随后结合BP神经网络对所有特征集合进行训练建模,得到最终的预测结果。将该算法与集成学习方法对比,运用基于Adaboost的梯度提升回归树和基于Bagging的随机森林回归算法分别对数据集进行训练。由实验结果分析,发现两步特征预测算法较其他算法减小了预测误差,部分算法比集成学习方法的预测效果更佳。
  3.本文对离散类型的特征子集进行one-hot稀疏编码,考虑因子分解机算法在处理稀疏数据集时作用显著,运用该算法进行回归预测。由于因子分解机算法可以较好地表达变量间的相互作用,相当于在原有特征变量的基础上还增加了二次交叉特征,更好地刻画数据集的特点。此外,因子分解机的算法复杂度不太高,且运行效率高。实验表明,因子分解机算法在一定程度上可以提高资金流入流出量的预测准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号