首页> 外国专利> Method and apparatus for mapping multiword expressions to identifiers using finite-state networks

Method and apparatus for mapping multiword expressions to identifiers using finite-state networks

机译:使用有限状态网络将多词表达式映射到标识符的方法和装置

摘要

Multiword expressions are mapped to identifiers using finite-state networks. Each of a plurality of multiword expressions is encoded into a regular expression. Each regular expression encodes a base form common to a plurality of derivative forms defined by ones of the multiword expressions. Each of the plurality of regular expressions is compiled with factorization into a set of finite-state networks. A union of the finite-state networks in the set of finite-state networks is performed to define a multiword finite-state network and a set of subnets. The multiword finite-state network and the set of subnets are traversed to identify a path corresponding to one of the plurality of multiword expressions, wherein only transitions originating from the multiword finite-state network are accounted for to ascertain a path number identifying a base form of the one of the plurality of multiword expressions.
机译:使用有限状态网络将多字表达式映射到标识符。多个多字表达式中的每一个都被编码为正则表达式。每个正则表达式编码由多个单词表达式中的一个定义的多个派生形式所共有的基本形式。多个正则表达式中的每一个都经过因子分解编译为一组有限状态网络。执行一组有限状态网络中的有限状态网络的并集,以定义多字有限状态网络和一组子网。遍历多字有限状态网络和子网集以标识与多个多字表达式之一相对应的路径,其中仅考虑源自多字有限状态网络的转换以确定路径号以标识基本形式多个多字表达式之一中的一个。

著录项

  • 公开/公告号US7552051B2

    专利类型

  • 公开/公告日2009-06-23

    原文格式PDF

  • 申请/专利权人 CAROLINE PRIVAULT;HERVE POIRIER;

    申请/专利号US20020248058

  • 发明设计人 CAROLINE PRIVAULT;HERVE POIRIER;

    申请日2002-12-13

  • 分类号G10L15/04;G06F17/27;

  • 国家 US

  • 入库时间 2022-08-21 19:31:13

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号