首页> 外国专利> STRUCTURED-TEXT CATALOGING METHOD, STRUCTURED-TEXT SEARCHING METHOD, AND PORTABLE MEDIUM USED IN THE METHODS

STRUCTURED-TEXT CATALOGING METHOD, STRUCTURED-TEXT SEARCHING METHOD, AND PORTABLE MEDIUM USED IN THE METHODS

机译:结构化文本编目方法,结构化文本搜索方法以及该方法中使用的便携式介质

摘要

A text cataloging method includes a step of catalogingalready-analyzed-text data obtained from an analysis of alogical structure of a text to be cataloged in a textdatabase, a step of creating a structure index by sequentiallysuperposing logical structures of texts to be cataloged,wherein a single metaelement is used for representing a groupof elements in the texts having the same position ofappearance in one of the texts and the same element type, asingle piece of meta-character-string data is used forrepresenting a group of pieces of character-string data in thetexts having the same position of appearance in one of thetexts, and a context identifier is assigned to each metanodecomposing a tree like structure of the structure index foruniquely identifying the metanode; a step of generatingstructured-full-text data composed of definitions ofassociative relations between all pieces of character-stringdata included in already-analyzed-text data of each text to becataloged, and context identifiers of pieces of meta-character-string data in the structure index used forrepresenting the pieces of character-string data; and acharacter-string-index updating step, including the sub-stepsof extracting partial character strings, generatingstructured-character-position information, and updating acharacter-string index.
机译:文本编目方法包括编目步骤通过分析以下内容获得的已分析文本数据要在文本中分类的文本的逻辑结构数据库,通过顺序创建结构索引的步骤叠加要分类的文本的逻辑结构,其中单个元元素用于表示一个组文本中具有相同位置的元素的在其中一种文本中出现并且元素类型相同,单个元字符字符串数据用于代表一组字符串数据在其中之一中具有相同出现位置的文本文本,并为每个元节点分配一个上下文标识符组成树形结构的结构索引唯一标识元节点;产生的步骤由以下定义组成的结构化全文数据所有字符串之间的关联关系每个文本的已分析文本数据中包含的数据分类,以及一些元数据的上下文标识符结构索引中的字符串数据用于表示字符串数据;和一个字符串索引更新步骤,包括子步骤提取部分字符串,生成结构化字符位置信息,并更新字符串索引。

著录项

  • 公开/公告号CA2230333C

    专利类型

  • 公开/公告日2003-08-05

    原文格式PDF

  • 申请/专利权人 HITACHI LTD.;

    申请/专利号CA19982230333

  • 申请日1998-02-24

  • 分类号G06F17/20;G06F7/00;

  • 国家 CA

  • 入库时间 2022-08-21 23:58:48

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号