文摘
英文文摘
学位论文独创性声明及使用授权声明
第一章绪论
1.1引言
1.2选题背景和研究意义
1.2.1选题背景
1.2.2研究意义
1.3本论文的主要内容和结构
第二章搜索引擎概述
2.1搜索引擎的概念和发展历史
2.2搜索引擎的分类
2.3搜索引擎面临的问题
2.4主题型搜索引擎的产生和优点
2.5目前研究状况
2.6搜索引擎的性能评价指标
2.7本章小结
第三章面向主题搜索引擎技术分析
3.1面向主题网络机器人技术研究
3.1.1主题机器人的结构
3.1.2主题机器人与通用机器人的区别
3.1.3主题机器人搜索策略
3.2Lucene索引技术研究
3.2.1 Lucene系统的结构组织
3.2.2Lucene索引机制架构
3.2.3Lucene索引的数据结构
3.2.4Lucene索引文件的格式描述
3.3信息检索技术
3.3.1信息检索模型
3.3.2Lucene全文检索与传统数据库检索
3.4本章小结
第四章应聘帮助信息主题搜索引擎的设计
4.1系统功能和目标
4.2设计思想和策略
4.2.1设计思想与难点分析
4.2.2技术策略
4.3系统总体和各模块结构
4.3.1主题抓取模块
4.3.2索引模块
4.3.3客户端检索模块
4.4系统实现相关技术
4.4.1 JavaI/O流
4.4.2 Java套接字编程实现HTTP请求
4.4.3 Java多线程编程
4.4.4中文分词技术
4.5可行性分析
4.6开发环境和系统运行
4.6.1开发环境
4.6.2系统解决方案与运行环境
4.7本章小结
第五章应聘帮助信息主题搜索引擎的实现
5.1主题信息采集模块的实现
5.1.1主题机器人流程设计
5.1.2多线程的实现
5.1.3主题采集模块的运行
5.2基于Lucene的索引与检索
5.2.1建立index的过程
5.2.2索引优化的作用
5.3中文分词技术
5.4搜索界面设计和实现
5.5信息更新
5.6本章小结
第六章结论与展望
参考文献
致谢