首页> 中文学位 >监督学习算法预测性能比较的正则化交叉验证方法研究
【6h】

监督学习算法预测性能比较的正则化交叉验证方法研究

代理获取

目录

第一章 绪论

1.1 研究背景及意义

1.2 数据切分的优化设计:正则化交叉验证方法

1.2.1 设计原则

1.2.2 研究现状

1.2.3 研究内容

1.2.4 解决的关键问题:正则化交叉验证的高效构造算法

1.3 基于正则化m×2交叉验证的统计推断方法

1.3.1 研究现状

1.3.2 研究内容

1.3.3 解决的关键问题:算法性能指标的任意两个2折交叉验证估计间的相关性分

1.4 本文的主要贡献

1.5 本文的内容安排

第二章 正则化RLT方法

2.1 记号及定义

2.2 正则化RLT的形式化描述

2.2.1 情形1:n1≥(J-1)n/J

2.2.2 情形2:n1=n/2且J 为偶数

2.2.3 情形3:n1=(J+1)n/(2J )且J 为奇数

2.2.4 正则化RLT切分集构造算法的时间复杂度分析

2.2.5 关于正则化RLT通用构造算法的讨论

2.3 实验数据及设置

2.4 实验结果及分析

2.4.1 研究问题一的模拟实验

2.4.2 研究问题二的模拟实验

2.4.3 研究问题三的模拟实验

2.5 附录

2.5.1 引理2.1的证明

2.5.2 正则化RLT中重叠样本个数矩阵与样例出现频次向量的取值

2.5.3 定理2.2的证明

2.5.4 定理2.3的证明

2.6 本章小结

第三章 正则化m×2交叉验证方法

3.1 记号及定义

3.2 m×2交叉验证估计的方差的理论分析

3.3 正则化m×2交叉验证切分集的增量式构造算法

3.4 重复次数m的选取

3.5 模拟实验

3.5.1 实验设置

3.5.2 问题一的模拟实验

3.5.3 问题二的模拟实验

3.5.4 问题三的模拟实验

3.6 真实数据集上的实验结果

3.7 附录:条件ω+γ-2τ的理论证明

3.7.1 均值回归下ω+γ>2τ的证明

3.7.2 一元线性回归下ω+γ>2τ的证明

3.7.3 多元线性回归下ω+γ>2τ 的证明

3.8 本章小结

第四章 文本数据的正则化m×2交叉验证初探

4.1 构造正则化交叉验证方法的基本思路

4.1.1 记号和定义

4.1.2 正则化m×2交叉验证求解的优化表示

4.1.3 训练集、验证集分布差异的度量函数

4.1.4 正则化参数如何选

4.2 文本数据集上正则化m×2交叉验证的切分集合的构造算法

4.3 基于正则化m×2交叉验证的序贯t检验

4.4 实验及结果分析

4.4.1 研究问题一的模拟实验

4.4.2 研究问题二的模拟实验

4.4.3 研究问题三的模拟实验

4.5 本章小结

第五章 针对泛化误差的正则化m×2交叉验证统计推断方法

5.1 问题描述

5.2 泛化误差差值μ的正则化m×2交叉验证序贯置信区间

5.2.1 回顾正则化m×2交叉验证方法

5.2.2 泛化误差差值μ的正则化m×2交叉验证估计

5.2.3 正则化m×2交叉验证估计的方差估计

5.2.4 基于正则化m×2交叉验证的t检验统计量

5.2.5 相关系数ρ1 和ρ2 的分析

5.3 正则化m×2交叉验证序贯t检验

5.4 停时mstop的分析

5.5 算法比较任务中现有的t检验

5.5.1 5×2交叉验证成对t检验

5.5.2 合并5×2交叉验证成对t检验

5.5.3 组块3×2交叉验证t检验

5.5.4 所有t检验的综合比较

5.6 实验设置和评价标准

5.7 正则化m×2交叉验证估计的方差的三个估计的比较实验

5.8 模拟数据上的实验

5.8.1 玩具数据集上的实验

5.8.2 UCI Letter数据集上的实验

5.9 附录

5.9.1 引理5.1的证明

5.9.2 引理5.2的证明

5.9.3 定理5.2的证明

5.9.4 样本均值中ρA,1 和ρA,2 的理论分析

5.9.5 定理5.3的证明

5.9.6 引理5.4的证明

5.9.7 定理5.4的证明

5.10 本章小结

第六章 针对准确率、召回率和F1值的正则化m×2交叉验证统计推断方法

6.1 问题引入

6.2 基于正则化m×2交叉验证的准确率、召回率及F1值的后验分布

6.2.1 Hold-out验证上准确率、召回率和F1 的后验分布

6.2.2 基于正则化m×2交叉验证的准确率、召回率和F1 值的后验分布

6.2.3 基于正则化m×2交叉验证的准确率、召回率和F1 值的置信区间

6.3 基于正则化m×2交叉验证的贝叶斯检验

6.4 实验及分析

6.4.1 中文分词任务:对比“BMES”和“BB2B3MES”

6.4.2 命名实体识别任务:对比“IOB2”和“IOBES”

6.4.3 组织名识别任务:对比“IOB2”和“IOBES”

6.4.4 小结

6.5 附录

6.5.1 式(6.7)的推导

6.5.2 式(6.17)的推导

6.6 本章小结

第七章 正则化m×2交叉验证在软件缺陷预测任务上的应用

7.1 软件缺陷预测任务的特点

7.2 软件缺陷预测任务中算法比较方法的研究现状

7.3 正则化m×2交叉验证序贯t检验在缺陷数预测任务上的应用

7.4 基于正则化m×2交叉验证的贝叶斯检验在缺陷倾向性预测任务上的应用

7.5 本章小结

结论及展望

参 考 文 献

攻读博士学位期间取得的研究成果

致谢

个人简况及联系方式

承 诺 书

声明

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号