首页> 外国专利> METHOD AND SYSTEM FOR TOPICAL SEGMENTATION OF DOCUMENT, SEGMENT SIGNIFICANCE AND SEGMENT FUNCTION

METHOD AND SYSTEM FOR TOPICAL SEGMENTATION OF DOCUMENT, SEGMENT SIGNIFICANCE AND SEGMENT FUNCTION

机译:用于文档的最大分割,分割的意义和分割功能的方法和系统

摘要

A "domain-general" method for topical segmentation of a document input includes the steps of: extracting one or more selected terms from a document; linking occurrences of the extracted terms based upon the proximity of similar terms; and assigning weighted scores to paragraphs of the document input corresponding to the linked occurrences. In accordance with the present invention, the values of the assigned scores depend upon the type of the selected terms, e.g., common noun, proper noun, pronominal, and the position of the linked occurrences with respect to the paragraphs, e.g., front, during, rear, etc. Upon zero-sum normalization, the assigned scores represent the boundaries of the topical segments of the document input.
机译:用于文档输入的主题分割的“领域通用”方法包括以下步骤:从文档中提取一个或多个选择的术语;基于相似术语的接近度来链接提取的术语的出现;并将加权分数分配给与链接出现相对应的文档输入的各个段落。根据本发明,分配分数的值取决于所选择的术语的类型,例如,普通名词,专有名词,代词,以及链接出现相对于段落的位置,例如,在前面, ,零等。归零归一化后,分配的分数代表文档输入的主题片段的边界。

著录项

  • 公开/公告号IL145874D0

    专利类型

  • 公开/公告日2002-07-25

    原文格式PDF

  • 申请/专利号IL20000145874

  • 发明设计人

    申请日2000-04-12

  • 分类号7G06FA;

  • 国家 IL

  • 入库时间 2022-08-22 00:44:51

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号