首页> 外国专利> Probabilistic word embeddings for text classification

Probabilistic word embeddings for text classification

机译:文本分类的概率词嵌入

摘要

Disclosed are systems, methods, and non-transitory computer-readable media for probabilistic word embeddings for text classification. A text classification system receives a message including a keyword and determines an embedding probability distribution representing the keyword. The text classification system then determines an embedding value for the keyword based on the embedding probability distribution. The text classification system uses the embedding value as input into a set of mathematical functions, yielding a first set of coefficient values for the keyword. Each respective mathematical function from the set corresponds to a respective classification label from a set of classification labels and defines a continuous surface. Each respective mathematical function is determined from embedding values for a set of known keywords, distribution variance values for the set of known keywords, and a subset of coefficient values for the set of known keywords that corresponds to the respective classification label.
机译:公开了用于文本分类的概率字嵌入的系统,方法和非暂时性计算机可读介质。文本分类系统接收包括关键字的消息,并确定表示关键字的嵌入概率分布。然后,文本分类系统基于嵌入概率分布确定关键字的嵌入值。文本分类系统使用嵌入值作为输入到一组数学函数中,产生关键字的第一组系数值。来自该集合的每个相应的数学函数对应于来自一组分类标签并定义连续表面的相应分类标签。每个相应的数学函数都是从嵌入值的嵌入值确定已知关键字的一组已知关键字的分发方差值,以及与相应的分类标签对应的已知关键字的集合的系数值子集。

著录项

  • 公开/公告号US11120223B2

    专利类型

  • 公开/公告日2021-09-14

    原文格式PDF

  • 申请/专利权人 SAP SE;

    申请/专利号US201916444794

  • 发明设计人 GIL KATZ;MATHIS LAMARRE;

    申请日2019-06-18

  • 分类号G06F40/295;H04L12/58;G06F40/216;

  • 国家 US

  • 入库时间 2022-08-24 21:01:23

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号