首页> 外国专利> Evaluating text classifier parameters based on semantic features

Evaluating text classifier parameters based on semantic features

机译:基于语义特征评估文本分类器参数

摘要

Systems and methods for evaluating text classifier parameters based on semantic features. An example method comprises: performing a semantico-syntactic analysis of a natural language text of a corpus of natural language texts to produce a semantic structure representing a set of semantic classes; identifying a natural language text feature to be extracted using a set of values of a plurality of feature extraction parameters; partitioning the corpus of natural language texts into a training data set comprising a first plurality of natural language texts and a validation data set comprising a second plurality of natural language texts; determining, in view of the category of the training data set, the set of values of the feature extraction parameters; validating the set of values of the feature extraction parameters using the validation data set.
机译:用于基于语义特征评估文本分类器参数的系统和方法。一种示例方法包括:对自然语言文本的语料库的自然语言文本执行语义-句法分析,以产生表示一组语义类别的语义结构;以及使用多个特征提取参数的一组值来识别要提取的自然语言文本特征;将自然语言文本的主体划分成包括第一多个自然语言文本的训练数据集和包括第二多个自然语言文本的验证数据集;根据训练数据集的类别,确定特征提取参数的值集;使用验证数据集验证特征提取参数的值集。

著录项

  • 公开/公告号US10078688B2

    专利类型

  • 公开/公告日2018-09-18

    原文格式PDF

  • 申请/专利权人 ABBYY INFOPOISK LLC;

    申请/专利号US201615157722

  • 发明设计人 SERGEY KOLOTIENKO;KONSTANTIN ANISIMOVICH;

    申请日2016-05-18

  • 分类号G06F17/30;G06F17/27;G06F17/28;

  • 国家 US

  • 入库时间 2022-08-21 13:06:01

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号