首页> 外国专利> System and method for determining affixes of words

System and method for determining affixes of words

机译:确定词缀的系统和方法

摘要

A computer system and a method for analyzing text in one or more electronic documents are disclosed. The computer system comprises one or more system interfaces; and an affix process that determines one or more affixes of one or more words in one or more of the documents and provides the affixes to the system interface. The preferred embodiment of the invention may be used to build a domain specific morphology lexicon for NLP applications so that they can recognize out-of-vocabulary words. The disclosed procedure utilizes the fact that the processes of discovering prefixes and suffixes are not independent. Many words, especially in technical documents, have complex morphological structures, and thus the knowledge about prefixes helps the discovery of suffixes and vice versa.
机译:公开了一种用于分析一个或多个电子文档中的文本的计算机系统和方法。该计算机系统包括一个或多个系统接口。以及词缀处理,其确定一个或多个文档中一个或多个单词的一个或多个词缀,并将词缀提供给系统界面。本发明的优选实施例可以用于建立用于NLP应用的领域特定的形态词典,以便它们可以识别出语音中的单词。所公开的过程利用以下事实:发现前缀和后缀的过程不是独立的。许多词,尤其是技术文档中的词,具有复杂的形态结构,因此有关前缀的知识有助于发现后缀,反之亦然。

著录项

  • 公开/公告号US2005055200A1

    专利类型

  • 公开/公告日2005-03-10

    原文格式PDF

  • 申请/专利权人 YOUNGJA PARK;

    申请/专利号US20030658968

  • 发明设计人 YOUNGJA PARK;

    申请日2003-09-09

  • 分类号G06F17/28;

  • 国家 US

  • 入库时间 2022-08-21 22:20:48

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号