声明
摘要
1 引言
1.1 研究背景及意义
1.2 国内外相关研究现状
1.3 研究内容及文章结构
1.3.1 本文研究内容
1.3.2 本文组织结构
2 相关理论和技术
2.1 数据质量
2.1.1 数据质量问题定义
2.1.2 数据质量维度评估
2.2 数据清洗
2.2.1 数据清洗
2.2.2 数据清洗基本原理
2.2.3 数据清洗的应用
2.3 可扩展标记语言XML
2.3.1 XML基本概念
2.3.2 XML相关技术
2.4 本章小结
3 XML数据清洗方法研究
3.1 XML数据质量问题
3.2 XML数据清洗方法研究
3.2.1 相关方法研究
3.2.2 XML相似性重复数据的清洗过程
3.3 本章小结
4 方法优化及模拟实验
4.1 XML相似性重复数据清洗框架
4.2 相似性数据检测方法优化
4.2.1 粒子群算法PSO
4.2.2 遗传算法GA
4.2.3 方法优化GA-PSO
4.3 清洗评估指标
4.4 模拟实验及结果分析
4.4.1 数据来源及实验环境
4.4.2 实验过程
4.4.3 实验结果分析
4.5 本章小结
5 总结与展望
5.1 本文总结
5.2 研究展望
参考文献
在学期间发表的学术论文和研究成果
致谢