【24h】

Document Retrieval Based on Subtopic Combination

机译:基于副主题组合的文档检索

获取原文

摘要

In many cases the subjects of document retrieval systems are whole documents. In a document like a thesis, multiple topics can be identified that all harmonize with the major. It is becoming more and more important to support retrieving not only main topics but also"supplementary" topics. In this paper we propose a new document retrieval method using the vector space model. It is based on the relationships among the topics of the document substructures. It gives precise document vectors even with very long documents containing several topics. We introduced the 'sequential' and 'include' query pattern for topic substructures. A uset can specify his/her demand with its context. We also built a prototype system, and conducted some experiments with a document set, Master's these of Information Science at NAIST, to demonstrate the effectiveness of our method.
机译:在许多情况下,文档检索系统的主题是整个文件。在一个像论文这样的文件中,可以确定多个主题,所有主题都与专业协调。支持不仅是主要主题而且“补充”主题而变得越来越重要。在本文中,我们提出了一种使用矢量空间模型的新文档检索方法。它基于文档子结构的主题之间的关系。即使包含多个主题的长期文档,它也会提供精确的文档向量。我们介绍了“顺序”和“包含”主题子结构的查询模式。 USET可以用上下文指定他/她的需求。我们还建立了一个原型系统,并在纳斯特省的文档集中进行了一些实验,掌握了这些信息科学,以证明我们方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号