首页> 中文期刊>电子学报 >有监督主题模型的SLDA-TC文本分类新方法

有监督主题模型的SLDA-TC文本分类新方法

     

摘要

本文提出了一种有监督主题模型的SLDA-TC(Supervised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其它文档中采样,并给出了理论推导;另外,其主题数只需略大于类别数.实验表明,对比LDA-TC(LDA-Text Categorization)和SVM算法,本方法能提高分类精度和时间性能.

著录项

  • 来源
    《电子学报》|2019年第6期|1300-1308|共9页
  • 作者单位

    山东工商学院计算机科学与技术学院,山东烟台264005;

    山东省高等学校协同创新中心:未来智能计算,山东烟台264005;

    山东省高校智能信息处理重点实验室山东工商学院,山东烟台264005;

    山东工商学院计算机科学与技术学院,山东烟台264005;

    山东省高等学校协同创新中心:未来智能计算,山东烟台264005;

    山东省高校智能信息处理重点实验室山东工商学院,山东烟台264005;

    山东工商学院计算机科学与技术学院,山东烟台264005;

    山东省高等学校协同创新中心:未来智能计算,山东烟台264005;

    山东省高校智能信息处理重点实验室山东工商学院,山东烟台264005;

    山东工商学院计算机科学与技术学院,山东烟台264005;

    山东省高等学校协同创新中心:未来智能计算,山东烟台264005;

    山东省高校智能信息处理重点实验室山东工商学院,山东烟台264005;

    大连海事大学信息科学技术学院,辽宁大连116026;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 自动推理、机器学习;
  • 关键词

    文本分类; 主题模型; 隐含Dirichlet分布; 吉布斯采样;

  • 入库时间 2023-07-24 21:25:54

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号