首页> 中文学位 >基于潜在语义分析的军事情报检索系统的研究与实现
【6h】

基于潜在语义分析的军事情报检索系统的研究与实现

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 研究背景

1.2 国内外研究现状

1.3 本文的主要工作

1.4 本文的组织结构

第二章 相关理论

2.1 信息检索概述

2.1.1 信息检索原理

2.1.2 信息检索类型

2.1.3 信息检索的意义

2.2 检索模型

2.2.1 布尔模型

2.2.2 向量空间模型

2.2.3 概率模型

2.3 处理技术

2.3.1 分词方法

2.3.2 命名实体的研究

2.3.3 句法结构的分析

2.4 关键词的抽取

2.4.1 关键词扩展

2.5 评测方法

2.5.1 平均准确率(MAP)

2.5.2 Q-measure

2.5.3 nDCG

2.6 本章小结

第三章 基于潜在语义索引的检索方法研究

3.1 问题的提出

3.2 潜在语义索引的基本思想

3.3 奇异值分解

3.4 LSI/SVD的特点

3.5 基于潜在语义索引的文本相似度计算

3.5.1 潜在语义索引中的权重

3.5.2 潜在语义索引中相似关系的计算

3.5.3 潜在语义索引中的实例分析

3.5.4 潜在语义索引中的文本信息检索的处理

3.6 本章小结

第四章 检索结果的排序融合研究

4.1 排序融合的原理

4.2 排序融合模式

4.3 融合策略

第五章 系统设计与实现

5.1 系统框架

5.2 系统功能说明

5.3 各子系统设计

5.3.1 基于词的检索系统

5.3.2 基于潜在语义分析的检索系统

5.4 测试语料库的设计

5.5 实验设置及评测标准

5.6 结果及结果分析

5.7 系统实现界面

5.8 本章小结

第六章 结论

6.1 工作内容与工作重点

6.2 未来工作方向

参考文献

致谢

展开▼

摘要

随着国防现代的深入发展,军事领域的电子信息被广泛地积累与应用,但如何快速并准确地从大量的数据中筛选出需要的信息却一直没有得到很好的解决。传统的检索系统,无论是受限领域的检索或搜索引擎,一般都是基于关键字进行检索,但算法仍停留在语言的表层,而没有触及语义,用户依旧很难快速、准确地定位到所需的信息。潜在语义分析正是在这样的背景下应运而生,该方法通过矩阵的奇异值分解将特征投影到语义空间,从语义角度来刻画文本的语义内容,在一定程度上降低了文本表示的高维性、稀疏性,同时解决了同义词和近义词问题。
   潜在语义利用词汇和文本间的潜在结构,将词汇和文本映射到同一个K维的语义空间内,在保持了原始的大部分信息的同时,克服了传统向量空间模型表示方法时产生的多义词、同义词和单词依赖的现象。但是,因子K值的选取直接关系到语义空间模型的效率,K值过小则会使一些有用的信息丢失,k值过大则会使运算量增大。而在实际应用中,人们也只能通过反复的实验来对K值进行确定。
   由此,本课题从两个方面展开相关的研究,一方面是在对潜在语义分析技术进行深入分析,并通过该方法对原始训练集中的特征进行抽取,从而提高检索结果的准确率和召回率:另一方面在信息检索阶段,通过融合技术将基于潜在语义分析的排序结果与基于向量空间的排序结果进行融合,由此改进潜在语义对K值的依赖,并实现检索结果排序的最优化。
   最终,本课题在以上的研究成果支持下,开发了相应的军事情报信息的检索系统,并成功应用于本单位的自动化管理中。实验证明本系统具有较高的实用价值,在检索的召回率和准确率等方面都有一定改善。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号