首页> 中文学位 >监督学习算法预测性能比较的正则化交叉验证方法研究

【6h】

监督学习算法预测性能比较的正则化交叉验证方法研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

第一章绪论

1.1 研究背景及意义

1.2 数据切分的优化设计：正则化交叉验证方法

1.2.1 设计原则

1.2.2 研究现状

1.2.3 研究内容

1.2.4 解决的关键问题：正则化交叉验证的高效构造算法

1.3 基于正则化m×2交叉验证的统计推断方法

1.3.1 研究现状

1.3.2 研究内容

1.3.3 解决的关键问题：算法性能指标的任意两个2折交叉验证估计间的相关性分

1.4 本文的主要贡献

1.5 本文的内容安排

第二章正则化RLT方法

2.1 记号及定义

2.2 正则化RLT的形式化描述

2.2.1 情形1：n1≥(J-1)n/J

2.2.2 情形2：n1=n/2且J 为偶数

2.2.3 情形3：n1=(J+1)n/(2J )且J 为奇数

2.2.4 正则化RLT切分集构造算法的时间复杂度分析

2.2.5 关于正则化RLT通用构造算法的讨论

2.3 实验数据及设置

2.4 实验结果及分析

2.4.1 研究问题一的模拟实验

2.4.2 研究问题二的模拟实验

2.4.3 研究问题三的模拟实验

2.5 附录

2.5.1 引理2.1的证明

2.5.2 正则化RLT中重叠样本个数矩阵与样例出现频次向量的取值

2.5.3 定理2.2的证明

2.5.4 定理2.3的证明

2.6 本章小结

第三章正则化m×2交叉验证方法

3.1 记号及定义

3.2 m×2交叉验证估计的方差的理论分析

3.3 正则化m×2交叉验证切分集的增量式构造算法

3.4 重复次数m的选取

3.5 模拟实验

3.5.1 实验设置

3.5.2 问题一的模拟实验

3.5.3 问题二的模拟实验

3.5.4 问题三的模拟实验

3.6 真实数据集上的实验结果

3.7 附录：条件ω+γ-2τ的理论证明

3.7.1 均值回归下ω+γ＞2τ的证明

3.7.2 一元线性回归下ω+γ＞2τ的证明

3.7.3 多元线性回归下ω+γ＞2τ 的证明

3.8 本章小结

第四章文本数据的正则化m×2交叉验证初探

4.1 构造正则化交叉验证方法的基本思路

4.1.1 记号和定义

4.1.2 正则化m×2交叉验证求解的优化表示

4.1.3 训练集、验证集分布差异的度量函数

4.1.4 正则化参数如何选

4.2 文本数据集上正则化m×2交叉验证的切分集合的构造算法

4.3 基于正则化m×2交叉验证的序贯t检验

4.4 实验及结果分析

4.4.1 研究问题一的模拟实验

4.4.2 研究问题二的模拟实验

4.4.3 研究问题三的模拟实验

4.5 本章小结

第五章针对泛化误差的正则化m×2交叉验证统计推断方法

5.1 问题描述

5.2 泛化误差差值μ的正则化m×2交叉验证序贯置信区间

5.2.1 回顾正则化m×2交叉验证方法

5.2.2 泛化误差差值μ的正则化m×2交叉验证估计

5.2.3 正则化m×2交叉验证估计的方差估计

5.2.4 基于正则化m×2交叉验证的t检验统计量

5.2.5 相关系数ρ1 和ρ2 的分析

5.3 正则化m×2交叉验证序贯t检验

5.4 停时mstop的分析

5.5 算法比较任务中现有的t检验

5.5.1 5×2交叉验证成对t检验

5.5.2 合并5×2交叉验证成对t检验

5.5.3 组块3×2交叉验证t检验

5.5.4 所有t检验的综合比较

5.6 实验设置和评价标准

5.7 正则化m×2交叉验证估计的方差的三个估计的比较实验

5.8 模拟数据上的实验

5.8.1 玩具数据集上的实验

5.8.2 UCI Letter数据集上的实验

5.9 附录

5.9.1 引理5.1的证明

5.9.2 引理5.2的证明

5.9.3 定理5.2的证明

5.9.4 样本均值中ρA,1 和ρA,2 的理论分析

5.9.5 定理5.3的证明

5.9.6 引理5.4的证明

5.9.7 定理5.4的证明

5.10 本章小结

第六章针对准确率、召回率和F1值的正则化m×2交叉验证统计推断方法

6.1 问题引入

6.2 基于正则化m×2交叉验证的准确率、召回率及F1值的后验分布

6.2.1 Hold-out验证上准确率、召回率和F1 的后验分布

6.2.2 基于正则化m×2交叉验证的准确率、召回率和F1 值的后验分布

6.2.3 基于正则化m×2交叉验证的准确率、召回率和F1 值的置信区间

6.3 基于正则化m×2交叉验证的贝叶斯检验

6.4 实验及分析

6.4.1 中文分词任务：对比“BMES”和“BB2B3MES”

6.4.2 命名实体识别任务：对比“IOB2”和“IOBES”

6.4.3 组织名识别任务：对比“IOB2”和“IOBES”

6.4.4 小结

6.5 附录

6.5.1 式（6.7）的推导

6.5.2 式（6.17）的推导

6.6 本章小结

第七章正则化m×2交叉验证在软件缺陷预测任务上的应用

7.1 软件缺陷预测任务的特点

7.2 软件缺陷预测任务中算法比较方法的研究现状

7.3 正则化m×2交叉验证序贯t检验在缺陷数预测任务上的应用

7.4 基于正则化m×2交叉验证的贝叶斯检验在缺陷倾向性预测任务上的应用

7.5 本章小结

结论及展望

参考文献

攻读博士学位期间取得的研究成果

致谢

个人简况及联系方式

承诺书

声明

展开▼

著录项

作者
王瑞波;
展开▼
作者单位

山西大学;

展开▼
授予单位山西大学;
学科软件工程
授予学位博士
导师姓名李济洪;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动化基础理论;
关键词
监督学习算法; 预测; 性能比较; 正则化; 交叉验证;

相似文献

中文文献
外文文献
专利

1. 正则化和交叉验证在组合预测模型中的应用 [J] . 张欣怡 ,袁宏俊 . 计算机系统应用 . 2020,第004期
2. 基于一致性正则化与熵最小化的半监督学习算法 [J] . 邵伟志 ,潘丽丽 ,雷前慧 . 郑州大学学报（理学版） . 2021,第003期
3. 基于交叉验证的XGBoost算法在岩爆烈度分级预测中的适用性探讨 [J] . 张钧博 ,何川 ,严健 . 隧道建设（中英文） . 2020,第S01期
4. 基于交叉验证的XGBoost算法在岩爆烈度分级预测中的适用性探讨 [J] . 张钧博 ,何川 ,严健 . 隧道建设 . 2020,第0z1期
5. 基于差分进化交叉验证SVM的飞控系统传感器故障预测学习算法研究 [J] . 尹伟 ,章卫国 ,宁东方 . 传感技术学报 . 2008,第011期
6. 基于交叉验证最小二乘支持向量机的风速预测 [C] . 虞俊 ,王冰 ,王平 . 中国高等学校电力系统及其自动化专业第二十四届学术年会 . 2008
7. 基于正则化交叉验证的静态软件缺陷预测方法研究 [A] . 刘亚娜 . 2019

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号