文摘
英文文摘
声明
第1章绪论
1.1研究的目的和意义
1.2相关的研究内容
1.2.1中文科技文献的自动分词
1.2.2中文科技文献检索系统
1.3本文的主要工作
1.4本文的组织结构
第2章科技文献的信息检索模型
2.1信息检索模型的定义
2.2基本概念
2.2.1关键词
2.2.2权值
2.2.3停用词
2.2.4关键词和权值的集合表示
2.3布尔检索模型
2.3.1布尔检索模型的理论基础
2.3.2布尔模型中文献的表示
2.3.3布尔模型中查询的表示
2.3.4布尔模型的匹配函数
2.3.5布尔模型的优缺点及其改进
2.4向量空间模型
2.4.1向量空间模型的文献空间
2.4.2标引词空间
2.4.3项的权值
2.4.4相似度计算
2.5概率模型
2.5.1事件空间
2.5.2相似度的计算
2.6本章小结
第3章信息检索系统中的向量空间分析
3.1空间的表示
3.1.1文献空间的表示
3.1.2位置空间的表示
3.1.3查询空间的表示
3.1.4文献关系矩阵的计算及其语义
3.2文献频率和逆文献频率的计算
3.2.1对关键词词频(tf)的规范化
3.2.2信息检索系统中逆文献频率(idf)的计算
3.3检索系统性能的评价
3.4对传统向量空间的适应
3.5本章小结
第4章关键词分析和自动分词
4.1关键词分析
4.2文献的结构分析
4.2.1文献的物理结构
4.2.2文献的逻辑结构
4.3汉语自动分词
4.3.1分词方法
4.3.2自动分词中的歧义处理
4.3.3分词词典
4.4科技文献信息检索系统中的自动分词
4.4.1词典的构建
4.4.2分词算法
4.5本章小结
第5章科技信息检索系统的构建
5.1文献中关键词的提取
5.2科技文献的向量表示和分析
5.2.1位置向量权值的计算
5.2.2位置向量的规范化处理
5.2.3文献向量的权值计算
5.2.4查询向量的表示
5.2.5文献—关键词矩阵的优化分析
5.2.6检索系统的评价
5.3本章小结
结论
参考文献
致谢