首页> 外国专利> METHODS AND SYSTEMS FOR EXTRACTING SELF-CREATED TERMS IN PROFESSIONAL AREA

METHODS AND SYSTEMS FOR EXTRACTING SELF-CREATED TERMS IN PROFESSIONAL AREA

机译:在专业领域提取自创建条款的方法和系统

摘要

The present disclosure discloses a method for extracting one or more self-created terms in a professional area. The method may include extracting one or more candidate terms from a text; determining first data representing an occurrence of each of the one or more candidate terms in the text; determining one or more lemmas of the each of the one or more candidate terms; determining second data representing an occurrence of each of the one or more lemmas in a general corpus; determining third data representing an occurrence of each of the one or more lemmas in a professional area corpus; and determining, based on reference data, a possibility that the each of the one or more candidate terms is a self-created term, wherein the reference data includes the first data, the second data, and the third data.
机译:本公开公开了一种用于在专业领域中提取一个或多个自我创造术语的方法。 该方法可以包括从文本中提取一个或多个候选术语; 确定文本中每个候选术语中的每个候选术语的发生的第一数据; 确定每个候选术语中的每一个的一个或多个lemmas; 确定一般语料库中的每个或多个lemmas的发生的第二数据; 确定专业区域语料库中的每个或多个LEMMA中的每一个的发生的第三数据; 并基于参考数据确定一个或多个候选术语的可能性是自创新项,其中参考数据包括第一数据,第二数据和第三数据。

著录项

  • 公开/公告号WO2021189291A1

    专利类型

  • 公开/公告日2021-09-30

    原文格式PDF

  • 申请/专利权人 METIS IP (SUZHOU) LLC;

    申请/专利号WO2020CN81083

  • 发明设计人 LI YAN;

    申请日2020-03-25

  • 分类号G06F16/33;

  • 国家 CN

  • 入库时间 2022-08-24 21:25:28

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号