首页> 外国专利> CROSS-LINGUAL UNSUPERVISED CLASSIFICATION WITH MULTI-VIEW TRANSFER LEARNING

CROSS-LINGUAL UNSUPERVISED CLASSIFICATION WITH MULTI-VIEW TRANSFER LEARNING

机译:多视图传输学习的交叉语言无监督分类

摘要

Presented herein are embodiments of an unsupervised cross-lingual sentiment classification model (which may be referred to as multi-view encoder-classifier (MVEC)) that leverages an unsupervised machine translation (UMT) system and a language discriminator. Unlike previous language model (LM)-based fine-tuning approaches that adjust parameters solely based on the classification error on training data, embodiments employ an encoder-decoder framework of an UMT as a regularization component on the shared network parameters. In one or more embodiments, the cross-lingual encoder of embodiments learns a shared representation, which is effective for both reconstructing input sentences of two languages and generating more representative views from the input for classification. Experiments on five language pairs verify that an MVEC embodiment significantly outperforms other models for 8/11 sentiment classification tasks.
机译:这里呈现的是无监督的交叉语言情绪分类模型的实施例(可以被称为利用无监督机器翻译(UMT)系统和语言鉴别器的多视图编码器 - 分类器(MVEC))。 与以前的语言模型(LM)相比,基于训练数据的分类误差调整参数的基于分类误差,实施例使用UMT的编码器解码器框架作为共享网络参数上的正则化组件。 在一个或多个实施例中,实施例的交叉语言编码器学习共享表示,这对于重建两种语言的输入句子并从输入的输入生成更多代表性视图。 五种语言对的实验验证了MVEC实施例显着优于8/11情绪分类任务的其他模型。

著录项

  • 公开/公告号EP3879429A2

    专利类型

  • 公开/公告日2021-09-15

    原文格式PDF

  • 申请/专利权人 BAIDU USA LLC;

    申请/专利号EP20210178520

  • 发明设计人 FEI HONGLIANG;LI PING;

    申请日2021-06-09

  • 分类号G06F40/30;G06F40/58;

  • 国家 EP

  • 入库时间 2022-08-24 21:03:29

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号