声明
摘要
第1章 引言
1.1 研究背景
1.2 本文的研究内容及面临的挑战
1.3 本文的贡献
1.4 本文的组织结构
第2章 相关工作
2.1 近似字符串查询算法
2.1.1 q-gram算法
2.1.2 VGRAM算法
2.1.3 q-chunk-gram算法
2.2 字符串集合近似连接算法
2.3 基于签名的过滤规则
2.4 本章小结
第3章 背景知识和问题定义
3.1 编辑距离
3.2 后缀树
3.3 BWT变换
3.3.1 BWT转换算法
3.3.2 基于BWT的反向搜索
3.4 问题定义
3.5 本章小结
第4章 基于变长签名的算法v-chunk-gram
4.1 基本的v-chunk-gram算法
4.1.1 变长签名的划分算法
4.1.2 变长chunk集合和变长gram集合的相似性
4.1.3 v-chunk-gram的查询算法
4.2 最优变长chunk算法
4.2.1 最优τ+1个变长chunk的划分算法
4.2.2 支持最优变长chunk划分的索引结构
4.2.3 公共签名数量下限的分析
4.3 本章小结
第5章 近似字符串匹配在DBMS中的实现
5.1 无索引结构的DBMS近似字符串匹配方法
5.1.1 无索引的gram在DBMS中的实现
5.1.2 无索引的chunk-gram在DBMS中的实现
5.2 基于索引结构的DBMS近似字符串匹配方法
5.2.1 基于索引的gram在DBMS中的实现
5.2.2 基于索引结构的chunk-gram在DBMS中的实现
5.3 本章小结
第6章 实验与分析
6.1 实验设置
6.2 查询性能对比及分析
6.2.1 查询性能对比
6.2.2 查询性能分析
6.3 索引结构对比
6.4 IndexVGram与CostBasedVGram对比分析
6.5 BestVChunk的进一步分析
6.6 无索引结构的DBMS实现
6.7 本章小结
第7章 结束语
7.1 本文总结
7.2 工作展望
参考文献
致谢
攻硕期间参加的项目及发表的论文