声明
摘要
第一章 绪论
1.1 研究背景及其意义
1.2 国内外研究现状
1.3 本文的主要工作
1.4 论文的结构安排
第二章 相关理论知识
2.1 文本特征选择
2.1.1 词频TF(Term Frequency)
2.1.2 互信息
2.1.3 期望交叉熵
2.1.4 信息增益
2.2 查询扩展
2.2.1 基于叙词表的查询扩展
2.2.2 基于局部上下文分析(LCA)的查询扩展
2.2.3 语义概念查询扩展
2.3 词义消歧
2.3.1 基于词典的词义消岐
2.3.2 基于统计的词义消岐
2.3.3 基于维基百科的词义消岐方法
2.4 语义知识库
2.5 主题模型
2.5.1 LDA模型简介
2.5.2 Tag-LDA模型
2.6 本章小结
第三章 基于标签筛选的文档排序方法
3.1 研究问题引出
3.2 互信息的改进方法
3.2.1 引入特征项分布的互信息方法
3.2.2 引入特征项位置信息的互信息方法
3.3 基于标签筛选的文档排序方法
3.3.1 基于互信息改进方法的标签筛选
3.3.2 基于标签筛选的文档排序方法
3.3.3 基于标签筛选的文档排序方法描述
3.4 基于标签筛选的文档排序方法系统框架
3.5 实验设计及结果分析
3.5.1 实验语料及对比系统
3.5.2 实验流程
3.5.3 筛选标签结果对比与分析
3.5.4 实验结果
3.6 本章小结
第四章 基于动态词语贡献度的文档排序方法
4.1 问题引出
4.2 基于动态词语贡献度的检索系统框架
4.2.1 查询信息接收
4.2.2 查询语句语义处理
4.2.3 词语贡献度动态计算
4.2.4 文本检索
4.3 基于动态词语贡献度的文档排序方法
4.3.1 相关公式
4.3.2 算法描述
4.4 实验设计及结果分析
4.4.1 实验流程
4.4.2 实验结果
4.5 本章小结
第五章 总结及进一步工作
5.1 总结
5.2 进一步工作
参考文献
攻读硕士学位期间公开发表的成果与参加的科研项目
致谢