首页> 外国专利> IDENTIFYING AND LINKING SIMILAR PASSAGES IN A DIGITAL TEXT CORPUS

IDENTIFYING AND LINKING SIMILAR PASSAGES IN A DIGITAL TEXT CORPUS

机译:识别和链接数字文本语料库中的类似段落

摘要

A corpus contains digital text from multiple documents. A passage miningengine identifies similar passages inthe documents and stores data describing the similarities. The passage miningengine groups similar passages into groups based ondegree of similarity or other criteria. The passage mining engine ranks thesimilar passages found in the text corpus based on qualityor other criteria. A user interface is presented that includes hypertext linksassociated with the similar passages that allow a user tonavigate the documents.
机译:语料库包含来自多个文档的数字文本。通道挖掘引擎识别出类似的段落文档并存储描述相似性的数据。通道挖掘引擎根据以下内容将相似的段落分组相似程度或其他标准。通道挖掘引擎将根据质量在文本语料库中找到相似的段落或其他条件。提供了一个包含超文本链接的用户界面与类似段落相关联,从而允许用户浏览文档。

著录项

  • 公开/公告号CA2691278C

    专利类型

  • 公开/公告日2013-09-24

    原文格式PDF

  • 申请/专利权人 GOOGLE INC.;

    申请/专利号CA20082691278

  • 申请日2008-07-18

  • 分类号G06F17/27;G06F17/30;

  • 国家 CA

  • 入库时间 2022-08-21 16:38:14

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号