声明
摘要
第1章 绪论
1.1 研究背景
1.2 问题提出
1.3 本文贡献
1.4 组织结构
第二章 背景知识
2.1 近似字符串匹配符号和定义
2.2 动态规划技术
2.3 自动机技术
2.4 文本分片技术
2.5 BPM-BM技术
2.6 多模式匹配
2.7 本章小结
第3章 问题定义
3.1 研究目标
3.2 基于拼音串的近似汉字串衡量标准
3.3 本章小结
第4章 中文字符串近似匹配
4.1 q-gram技术
4.2 汉字转拼音
4.2.1 汉字串转换为拼音串
4.2.2 建立拼音汉字对照字典
4.3 构造面向拼音串的候选集
4.3.1 建立双元素倒排索引
4.3.2 查找近似字符串在句串中的可能位置
4.4 构造中文字符串的候选集
4.4.1 查找近似串的有效拼音字符位置
4.4.2 计算编辑距离并输出近似汉字串
4.5 本章小结
第5章 实验与分析
5.1 实验设置
5.2 系统界面
5.3 实验演示
5.3.1 不同长度查询串的查询效果演示
5.3.2 不同编辑距离的查询效果演示
5.4 影响系统性能的主要因素
5.4.1 数据文本集的大小对查询时间的影响
5.4.2 查询串的长短对查询时间的影响
5.4.3 编辑距离的大小对查询时间的影响
5.5 本章小结
第6章 总结与展望
6.1 本文工作总结
6.2 未来工作
参考文献
致谢
攻硕期间参加的项目