声明
摘要
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 全文检索技术的发展及应用
1.2.2 中文分词技术
1.2.3 总结分析
1.3 研究内容与方法
1.3.1 研究目标与内容
1.3.2 研究方法与技术路线
1.4 论文的组织结构
2.1 全文检索
2.1.1 全文检索简介
2.1.2 全文检索框架
2.2 全文索引模型
2.2.1 位图及署名文件模型
2.2.2 倒排表模型
2.2.3 后缀树模型
2.2.4 全文索引模型评价
2.3 检索模型
2.3.1 布尔检索模型
2.3.2 向量空间模型
2.3.3 概率模型
3.1 中文分词简介
3.1.1 中文分词难点
3.1.2 中文分词算法
3.2 基于词典的中文分词方法
3.2.1 词典分词
3.2.2 词典机制
3.3 基于统计的分词方法
3.3.1 互信息模型
3.3.2 N-gram模型
3.3.3 隐马尔科夫模型
3.3.4 条件随机场
3.4 基于词典与统计结合的中文分词方法
3.4.1 本文分词算法设计
3.4.2 实验结果及分析
3.5 分词算法比较与评价
4.资源库全文检索系统设计
4.1 全文检索框架Lucene
4.1.1 Lucene索引结构
4.1.2 Lucene检索过程
4.1.3 Lucene分析器
4.2 武当山资源库概述
4.3 全文检索系统设计
4.3.1 功能设计
4.3.2 文档录入与提取模块设计
4.3.3 索引模块设计
4.3.4 查询模块设计
4.3.5 结果分析
5.1 总结
5.2 展望
参考文献
致谢