封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1本文研究背景
1.2 术语相似度计算国内外研究综述
1.3 本文研究目的及意义
1.4 本文的主要研究工作
第二章 术语相似度计算研究总体思路及基础关键技术
2.1 相似度计算研究总体思路
2.2 基础关键技术
2.3 需要进一步的改造工作
2.4 本章小结
第三章 基于交通主题的Heritrix的扩展及改进
3.1交通主题爬虫系统工作流程
3.2开发解析特定交通主题网站的解析器Extractor
3.3交通网页信息抓取测试
3.4本章总结
第四章 交通信息网页的解析与处理
4.1网页信息的一般分析策略
4.2实现交通信息网页的解析
4.3本章总结
第五章 构建交通信息的全文索引
5.1全文检索及其检索系统的概念
5.2 传统检索方式的优点和不足
5.3倒排索引机制
5.4评价信息检索系统索引的标准
5.5基于Lucene的索引架构
5.6交通主题信息的全文索引实现
5.7利用Luke索引浏览器实现完整的查询功能
5.8本章小结
第六章 交通术语相似度计算
6.1基于网络知识资源的术语相似度算法
6.2基于交通信息垂直检索系统的Web-PMI算法实现
6.3算法测评
6.4 本章小结
总结和展望
参考文献
致谢
攻读学位期间发表的论文与参与研究项目
长安大学;