首页> 外国专利> Apparatus and Method for Standardizing Textual Elements of an Unstructured Text

Apparatus and Method for Standardizing Textual Elements of an Unstructured Text

机译:用于标准化非结构化文本的文本元素的设备和方法

摘要

In one embodiment the present invention includes a method for standardizing certain textual elements of an unstructured text to enhance the use of the unstructured text as a data source for an analytical processing tool. In accordance with one or more user-defined pre-processing directives, a pre-processing logic identifies textual elements of a certain type, and converts the underlying textual elements to conform to user-defined standards for the particular type. The converted textual element is then inserted into the unstructured text, or an index based on the unstructured text, thereby improving the use of the unstructured text as a data source for conventional analytical processing (e.g., querying) tools.
机译:在一个实施例中,本发明包括一种用于标准化非结构化文本的某些文本元素以增强非结构化文本作为分析处理工具的数据源的使用的方法。根据一个或多个用户定义的预处理指令,预处理逻辑识别某种类型的文本元素,并转换基础文本元素以符合特定类型的用户定义标准。然后将转换后的文本元素插入到非结构化文本或基于非结构化文本的索引中,从而改善了将非结构化文本用作常规分析处理(例如,查询)工具的数据源的用途。

著录项

  • 公开/公告号US2009259995A1

    专利类型

  • 公开/公告日2009-10-15

    原文格式PDF

  • 申请/专利权人 WILLIAM H. INMON;

    申请/专利号US20080103144

  • 发明设计人 WILLIAM H. INMON;

    申请日2008-04-15

  • 分类号G06F9/44;

  • 国家 US

  • 入库时间 2022-08-21 19:36:15

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号