首页> 外国专利> AUTOMATIC EVALUATION AND VALIDATION OF TEXT MINING ALGORITHMS

AUTOMATIC EVALUATION AND VALIDATION OF TEXT MINING ALGORITHMS

机译:文本挖掘算法的自动评估和验证

摘要

In some embodiments, the disclosed subject matter involves comparing the results of natural language processing (NLP) of unstructured text to historical results for verification and validation of the NLP models/algorithms. The analysis uses statistical theory and practices to automatically monitor and validate the performances of the (NLP) algorithms on a periodic basis. Each unstructured text is run through one or more NLP algorithms and scored for relevance or contextual classification. Distribution of the scores is assumed to be Gaussian in nature so that a probability value (p-value) may be generated. When the p-value is below a threshold value, manual tagging may be initiated for the current time period to help retrain the models for better performance. Other embodiments are described and claimed.
机译:在一些实施例中,所公开的主题涉及将非结构化文本的自然语言处理(NLP)的结果与历史结果进行比较,以用于NLP模型/算法的验证和确认。该分析使用统计理论和实践来定期自动监视和验证(NLP)算法的性能。每个非结构化文本都通过一种或多种NLP算法运行,并为相关性或上下文分类打分。假定分数的分布本质上是高斯的,因此可以生成概率值(p值)。当p值低于阈值时,可以在当前时间段启动手动标记,以帮助重新训练模型以获得更好的性能。描述和要求保护其他实施例。

著录项

  • 公开/公告号US2018322411A1

    专利类型

  • 公开/公告日2018-11-08

    原文格式PDF

  • 申请/专利权人 LINKEDIN CORPORATION;

    申请/专利号US201715586739

  • 申请日2017-05-04

  • 分类号G06N99;G06F17/30;G06N7;

  • 国家 US

  • 入库时间 2022-08-21 12:56:46

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号