首页> 外国专利> REPRESENTATION LEARNING FOR INPUT CLASSIFICATION VIA TOPIC SPARSE AUTOENCODER AND ENTITY EMBEDDING

REPRESENTATION LEARNING FOR INPUT CLASSIFICATION VIA TOPIC SPARSE AUTOENCODER AND ENTITY EMBEDDING

机译:通过主题稀疏自动编码器和实体嵌入进行输入分类的表示学习

摘要

Described herein are embodiments of a unified neural network framework to integrate Topic modeling, Word embedding and Entity Embedding (TWEE) for representation learning of inputs. In one or more embodiments, a novel topic sparse autoencoder is introduced to incorporate discriminative topics into the representation learning of the input. Topic distributions of inputs are generated from a global viewpoint and are utilized to enable autoencoder to learn topical representations. A sparsity constraint may be added to ensure that the most discriminative representations are related to topics. In addition, both words and entity related information may be embedded into the network to help learn a more comprehensive input representation. Extensive empirical experiments show that embodiments of the TWEE framework outperform the state-of-the-art methods on different datasets.
机译:这里描述的是统一的神经网络框架的实施例,该框架集成了主题建模,词嵌入和实体嵌入(TWEE)以用于输入的表示学习。在一个或多个实施例中,引入了新颖的主题稀疏自动编码器,以将判别性主题合并到输入的表示学习中。输入的主题分布是从全局角度生成的,并用于使自动编码器能够学习主题表示。可以添加稀疏性约束以确保最具区分性的表示形式与主题相关。此外,单词和与实体相关的信息都可以嵌入网络中,以帮助学习更全面的输入表示。广泛的经验实验表明,TWEE框架的实施例优于不同数据集上的最新方法。

著录项

  • 公开/公告号US2020184339A1

    专利类型

  • 公开/公告日2020-06-11

    原文格式PDF

  • 申请/专利权人 BAIDU USA LLC;

    申请/专利号US201916691554

  • 发明设计人 DINGCHENG LI;JINGYUAN ZHANG;PING LI;

    申请日2019-11-21

  • 分类号G06N3/08;G06N3/04;G06F17/18;G06K9/62;

  • 国家 US

  • 入库时间 2022-08-21 11:27:34

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号