首页> 外国专利> Computerized searchable document repository using separate metadata and content stores and full text indexes

Computerized searchable document repository using separate metadata and content stores and full text indexes

机译:使用单独的元数据和内容存储库以及全文本索引的计算机化可搜索文档存储库

摘要

A computerized searchable repository stores documents as structured metadata parts and unstructured content parts using single instancing. A full text index used for keyword searching includes a metadata index and a content index. A linking structure includes metadata-to-content (MD to CT) links and content-to-metadata (CT to MD) linking entries, with each MD to CT link linking a metadata part of a document to each content part of the document, and each CT to MD linking entry having one or more CT to MD links collectively linking a content part to the metadata parts of the documents that include the content part. Indexing includes metadata indexing a metadata part, conditionally content indexing a content part, and updating the linking structure. Content indexing is performed only if the content part does not match a content part already stored and indexed. Index entries each associate a key word or key value with corresponding metadata or content parts containing the key word or key value. Updating the linking structure includes generating new MD to CT and CT to MD links between the metadata part and either the new content part or an existing matching content part if present.
机译:计算机化的可搜索存储库使用单实例化将文档存储为结构化的元数据部分和非结构化的内容部分。用于关键字搜索的全文索引包括元数据索引和内容索引。链接结构包括元数据到内容(MD到CT)链接和内容到元数据(CT到MD)链接条目,每个MD到CT链接将文档的元数据部分链接到文档的每个内容部分,每个具有一个或多个CT到MD链接的CT到MD链接条目,共同将内容部分链接到包括该内容部分的文档的元数据部分。索引包括元数据索引元数据部分,有条件地内容索引内容部分以及更新链接结构。仅当内容部分与已经存储并建立索引的内容部分不匹配时,才执行内容索引。每个索引条目将关键字或关键字值与包含该关键字或关键字值的相应元数据或内容部分相关联。更新链接结构包括在元数据部分与新内容部分或现有的匹配内容部分(如果存在)之间生成新的MD到CT和CT到MD链接。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号