文摘
英文文摘
声明
第1章 绪论
1.1.研究背景
1.2. 相关研究技术和背景
1.2.1互联网发展
1.2.2搜索引擎的发展与技术
1.2.3网页地址——URL(全球资源定位器)
1.2.4中文汉语拼音
1.3.论文的主要工作
1.4.本文组织结构
第2章 中文URL信息提取算法的分析
2.1中文URL构成特征棕述
2.1.1拼音首字母组合
2.1.2全拼音组合
2.1.3全英文组合
2.1.4英文前缀组合
2.1.5杂项组合
2.2自动提取算法分析
2.2.1直接提取算法
2.2.2间接查找翻译
2.3小结
第3章 中文URL信息提取算法的实现
3.1算法总体设计
3.2 初始化数据模块
3.2.1数据定义
3.3中文分词模块
3.3.1中文分词模块类图
3.3.2中文分词模块接口
3.4中文翻译模块
3.4.1中英翻译模块
3.4.2中拼翻译模块
3.5查找匹配模块
3.5.1新的查找字典
3.5.2查找匹配算法
3.6小结
第4章 算法测试与验证
4.1算法正确性的验证
4.1.1标注工具
4.1.2数据的验证
4.1.2数据的验证的改进
第5章 结束语
5.1总结
参考文献
附录1 码表映射法——码表代码
致谢
发表的学术论文目录