首页> 外国专利> SYSTEMS, APPARATUSES, AND METHOD FOR DOCUMENT INGESTION

SYSTEMS, APPARATUSES, AND METHOD FOR DOCUMENT INGESTION

机译:文档摄取的系统,装置和方法

摘要

Techniques for intaking one or more documents are described. An exemplary method includes receiving an ingestion request to ingest a document; extracting text from the document; pre-processing the extracted text to generate pre-processed text that is predictable and analyzable; generating an index entry for the extracted text, the index entry to map the extracted text to a reserved field of a plurality of reserved fields; and storing the extracted text, index entry, and pre-processed text in at least one data storage location
机译:描述了一种或多个文件的技术。示例性方法包括接收Engestion请求以摄取文件;从文件中提取文本;预处理提取的文本以生成预处理的文本,可预测和分析;为提取的文本生成索引条目,将提取的文本映射到多个保留字段的保留字段的索引条目;并在至少一个数据存储位置存储提取的文本,索引条目和预处理文本

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号