首页> 中文期刊> 《电子学报》 >Tr-SLDA:一种面向交叉领域的迁移主题模型

Tr-SLDA:一种面向交叉领域的迁移主题模型

         

摘要

当目标领域缺少足够多的标注数据时,迁移学习利用相关源领域的标注数据,辅助提升目标域的学习性能,但是目标域与源域的数据通常不满足独立同分布,容易导致"负迁移"问题.本文在有监督主题模型(Supervised LDA,SLDA)的基础上,融合迁移学习方法提出一种共享主题知识的迁移主题模型(Transfer SLDA,Tr-SLDA),提出Tr-SLDA-Gibbs主题采样新方法,在类别标签的约束下对不同领域文档中的词采取不同的采样策略,且无需指定主题个数.辅助源域与目标域共享潜在主题空间,Tr-SLDA通过发现潜在共享主题与不同领域类别之间的语义关联从源域迁移知识,可以有效解决"负迁移"问题.基于Tr-SLDA迁移主题模型提出Tr-SLDA-TC(Tr-SLDA Text Categorization)文本分类方法.对比实验表明,该方法可有效利用源域知识来提高目标领域的分类性能.

著录项

  • 来源
    《电子学报》 |2021年第3期|605-613|共9页
  • 作者单位

    山东工商学院计算机科学与技术学院 山东烟台 264005;

    山东工商学院信息与电子工程学院 山东烟台 264005;

    山东省高校智能信息处理重点实验室(山东工商学院) 山东烟台 264005;

    山东工商学院信息与电子工程学院 山东烟台 264005;

    山东工商学院计算机科学与技术学院 山东烟台 264005;

    山东工商学院信息与电子工程学院 山东烟台 264005;

    山东工商学院计算机科学与技术学院 山东烟台 264005;

    山东省高等学校协同创新中心:未来智能计算 山东烟台 264005;

    山东省高校智能信息处理重点实验室(山东工商学院) 山东烟台 264005;

    大连海事大学信息科学技术学院 辽宁大连 116026;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 自动推理、机器学习;
  • 关键词

    文本分类; 主题模型; 吉布斯采样; 迁移学习; 负迁移;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号