第1章 绪论
1.1 研究背景
1.2 研究现状及分析
1.2.1 多源同构数据真值发现分析
1.2.2 多源异构数据真值发现分析
1.2.3 文本数据真值发现分析
1.2.4 现有工作的不足
1.3 本文的主要研究内容
1.4 本文章节安排
第2章 基于函数依赖的多源同构数据真值发现
2.1 引言
2.2 问题定义
2.3 AutoRepair算法
2.3.1 框架
2.3.2 处理独立约束集
2.3.3 处理关联约束集
2.3.4 源间数据聚合
2.3.5 更新源可靠分数
2.3.6 算法性能分析
2.4 实验结果
2.4.1 实验设置
2.4.2 算法在合成数据集上的实验
2.4.3 算法在真实数据集上的实验
2.4.4 实验小结
2.5 本章小结
第3章 基于否定约束的多源同构数据真值发现
3.1 引言
3.2 问题定义
3.3 CTD算法
3.3.1 否定依赖转换
3.3.2 解决方案
3.3.3 算法性能分析
3.3.4 算法改进策略
3.4 实验结果
3.4.1 实验设置
3.4.2 算法有效性评估
3.4.3 算法效率评估
3.5 本章小结
第4章 基于模式发现的多源异构数据真值发现
4.1 引言
4.2 问题定义
4.3 PatternFinder算法
4.3.1 框架概览
4.3.2 优化目标
4.3.3 迭代过程
4.3.4 算法性能分析
4.3.5 优化分组策略
4.3.6 模式和真值生成
4.4 实验结果
4.4.1 实验设置
4.4.2 算法在合成数据集上的实验
4.4.3 算法在真实数据集上的实验
4.5 本章小结
第5章 基于模式评估的多源文本数据真值发现
5.1 引言
5.2 预备知识
5.2.1 预处理
5.2.2 问题定义
5.3 CNN-LSTM模型
5.3.1 元组编码
5.3.2 模式编码
5.3.3 训练和推理
5.4 实验结果
5.4.1 实验设置
5.4.2 模型有效性评估
5.4.3 模型效率评估
5.5 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其他成果
声明
致谢
个人简历
哈尔滨工业大学;