第一章 绪论
1.1 研究背景及意义
1.2 数据切分的优化设计:正则化交叉验证方法
1.2.1 设计原则
1.2.2 研究现状
1.2.3 研究内容
1.2.4 解决的关键问题:正则化交叉验证的高效构造算法
1.3 基于正则化m×2交叉验证的统计推断方法
1.3.1 研究现状
1.3.2 研究内容
1.3.3 解决的关键问题:算法性能指标的任意两个2折交叉验证估计间的相关性分
1.4 本文的主要贡献
1.5 本文的内容安排
第二章 正则化RLT方法
2.1 记号及定义
2.2 正则化RLT的形式化描述
2.2.1 情形1:n1≥(J-1)n/J
2.2.2 情形2:n1=n/2且J 为偶数
2.2.3 情形3:n1=(J+1)n/(2J )且J 为奇数
2.2.4 正则化RLT切分集构造算法的时间复杂度分析
2.2.5 关于正则化RLT通用构造算法的讨论
2.3 实验数据及设置
2.4 实验结果及分析
2.4.1 研究问题一的模拟实验
2.4.2 研究问题二的模拟实验
2.4.3 研究问题三的模拟实验
2.5 附录
2.5.1 引理2.1的证明
2.5.2 正则化RLT中重叠样本个数矩阵与样例出现频次向量的取值
2.5.3 定理2.2的证明
2.5.4 定理2.3的证明
2.6 本章小结
第三章 正则化m×2交叉验证方法
3.1 记号及定义
3.2 m×2交叉验证估计的方差的理论分析
3.3 正则化m×2交叉验证切分集的增量式构造算法
3.4 重复次数m的选取
3.5 模拟实验
3.5.1 实验设置
3.5.2 问题一的模拟实验
3.5.3 问题二的模拟实验
3.5.4 问题三的模拟实验
3.6 真实数据集上的实验结果
3.7 附录:条件ω+γ-2τ的理论证明
3.7.1 均值回归下ω+γ>2τ的证明
3.7.2 一元线性回归下ω+γ>2τ的证明
3.7.3 多元线性回归下ω+γ>2τ 的证明
3.8 本章小结
第四章 文本数据的正则化m×2交叉验证初探
4.1 构造正则化交叉验证方法的基本思路
4.1.1 记号和定义
4.1.2 正则化m×2交叉验证求解的优化表示
4.1.3 训练集、验证集分布差异的度量函数
4.1.4 正则化参数如何选
4.2 文本数据集上正则化m×2交叉验证的切分集合的构造算法
4.3 基于正则化m×2交叉验证的序贯t检验
4.4 实验及结果分析
4.4.1 研究问题一的模拟实验
4.4.2 研究问题二的模拟实验
4.4.3 研究问题三的模拟实验
4.5 本章小结
第五章 针对泛化误差的正则化m×2交叉验证统计推断方法
5.1 问题描述
5.2 泛化误差差值μ的正则化m×2交叉验证序贯置信区间
5.2.1 回顾正则化m×2交叉验证方法
5.2.2 泛化误差差值μ的正则化m×2交叉验证估计
5.2.3 正则化m×2交叉验证估计的方差估计
5.2.4 基于正则化m×2交叉验证的t检验统计量
5.2.5 相关系数ρ1 和ρ2 的分析
5.3 正则化m×2交叉验证序贯t检验
5.4 停时mstop的分析
5.5 算法比较任务中现有的t检验
5.5.1 5×2交叉验证成对t检验
5.5.2 合并5×2交叉验证成对t检验
5.5.3 组块3×2交叉验证t检验
5.5.4 所有t检验的综合比较
5.6 实验设置和评价标准
5.7 正则化m×2交叉验证估计的方差的三个估计的比较实验
5.8 模拟数据上的实验
5.8.1 玩具数据集上的实验
5.8.2 UCI Letter数据集上的实验
5.9 附录
5.9.1 引理5.1的证明
5.9.2 引理5.2的证明
5.9.3 定理5.2的证明
5.9.4 样本均值中ρA,1 和ρA,2 的理论分析
5.9.5 定理5.3的证明
5.9.6 引理5.4的证明
5.9.7 定理5.4的证明
5.10 本章小结
第六章 针对准确率、召回率和F1值的正则化m×2交叉验证统计推断方法
6.1 问题引入
6.2 基于正则化m×2交叉验证的准确率、召回率及F1值的后验分布
6.2.1 Hold-out验证上准确率、召回率和F1 的后验分布
6.2.2 基于正则化m×2交叉验证的准确率、召回率和F1 值的后验分布
6.2.3 基于正则化m×2交叉验证的准确率、召回率和F1 值的置信区间
6.3 基于正则化m×2交叉验证的贝叶斯检验
6.4 实验及分析
6.4.1 中文分词任务:对比“BMES”和“BB2B3MES”
6.4.2 命名实体识别任务:对比“IOB2”和“IOBES”
6.4.3 组织名识别任务:对比“IOB2”和“IOBES”
6.4.4 小结
6.5 附录
6.5.1 式(6.7)的推导
6.5.2 式(6.17)的推导
6.6 本章小结
第七章 正则化m×2交叉验证在软件缺陷预测任务上的应用
7.1 软件缺陷预测任务的特点
7.2 软件缺陷预测任务中算法比较方法的研究现状
7.3 正则化m×2交叉验证序贯t检验在缺陷数预测任务上的应用
7.4 基于正则化m×2交叉验证的贝叶斯检验在缺陷倾向性预测任务上的应用
7.5 本章小结
结论及展望
参 考 文 献
攻读博士学位期间取得的研究成果
致谢
个人简况及联系方式
承 诺 书
声明