摘要
1.1研究的目的与意义
1.2数据质量维度
1.2.1完整性
1.2.2一致性
1.2.3准确性
1.2.4时效性
1.3国内外研究现状
1.3.1数据完整性的研究现状
1.3.2数据源选择的研究现状
1.4本文主要研究工作
1.5本文的主要结构
第2章预备知识
2.1引言
2.2不完整性
2.3规则介绍
2.4最小哈希(min-hash)
2.5遗传算法
2.6本章小结
第3章基于最小哈希签名填充缺失属性值的数据源选择策略
3.1引言
3.2问题定义
3.3基于完整性填充的数据源选择算法
3.3.1算法设计
3.3.2估计填充
3.3.3最小哈希签名
3.4实验
3.4.1实验环境
3.4.2实验比较
3.4.3参数的影响
3.4.4实验效率
3.4.5结论
3.5本章小结
第4章基于遗传算法填充缺失元组的数据源选择策略
4.1引言
4.2问题定义
4.3算法设计
4.3.1遗传算法
4.3.2编码方式
4.3.3适应度函数构造
4.3.4算法设计
4.4实验结果与分析
4.4.1实验设置
4.4.2参数影响
4.4.3最优解
4.4.4实验结论
4.5本章小结
结论
参考文献
致谢
攻读硕士学位期问发表的学术论文及参加的科研项目
声明
黑龙江大学;