用于多标签分类的改进Labeled LDA模型

江雨燕; 李平; 王清

首页> 中文期刊> 《南京大学学报：自然科学版》 >用于多标签分类的改进Labeled LDA模型

用于多标签分类的改进Labeled LDA模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

概率主题模型由于其优良的文档分析能力,被广泛应用于各种文本分析任务中.然而,网络中的文档数据除了含有基本的内容信息外,同时还可能存在文档类别、作者等信息.如何通过主题模型对这些信息进行有效的分析,已经成为机器学习、自然语言处理等领域的重点研究方向.本文通过对隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)及其扩展模型的研究,提出一种适用于文档多标签判定的改进Labeled LDA模型.模型中的标记被映射为多个主题的组合,其中包含若干个独享的主题和共享主题.在文档类别判定过程中通过联合独享主题和共享主题来对类别进行预测.为了验证算法的有效性本文将提出的模型分别与PLDA模型及其他非主题模型进行了对比.实验结果表明,改进LabeledLDA模型能够有效解决PLDA模型无法有效分析类别标记之间共享主题的问题,具有明显优于PLDA和其他非主题模型的多标签判定能力.

著录项

来源
《南京大学学报：自然科学版》 |2013年第4期|425-432|共8页
作者
江雨燕; 李平; 王清;
展开▼
作者单位

安徽工业大学管理科学与工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP311.13;
关键词
主题模型; 隐含狄利克雷分配; 多标签分类; 共享主题;

相似文献

中文文献
外文文献
专利

1. 基于改进Labeled LDA模型的科技视频文本分类 [J] . 马建红 ,樊跃翔 . 计算机工程 . 2018 ,第009期
2. 基于Labeled LDA主题模型的医学文献自动分类法 [J] . 宫小翠 ,安新颖 ,单连慧 . 中华医学图书情报杂志 . 2018 ,第010期
3. 一种解决“中心主题湮没问题”的基于图模型的Labeled-LDA文本分类算法 [J] . 李伟 ,马永征 ,沈一 . 计算机科学 . 2014 ,第003期
4. 基于Labeled-LDA模型的文本分类新算法 [J] . 李文波 ,孙乐 ,张大鲲 . 计算机学报 . 2008 ,第004期
5. 基于LDA主题模型的文本语料情感分类改进方法 [J] . 郭晓慧 . 延边大学学报（自然科学版） . 2018 ,第003期
6. 基于Labeled LDA主题模型的医学文献自动分类方法 [C] . 宫小翠 ,安新颖 ,单连慧 . 中华医学会第二十四次全国医学信息学术会议 . 2018
7. 改进Labeled LDA模型在科技领域视频文本分类的应用 [A] . 樊跃翔 . 2018

用于多标签分类的改进Labeled LDA模型

摘要

著录项

相似文献

相关主题

期刊订阅