基于LDA模型的网络刊物主题发现与聚类

杨传春; 张冰雪; 李仁德; 郭强

首页> 中文期刊> 《上海理工大学学报》 >基于LDA模型的网络刊物主题发现与聚类

基于LDA模型的网络刊物主题发现与聚类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

随着智能终端的普及,文本的主题挖掘需求也越来越广泛,主题建模是文本主题挖掘的核心,LDA生成模型是基于贝叶斯框架的概率模型,它以语义关联为基础,很好地解决了文本潜在主题的提取问题.对文本聚类过程的核心技术LDA生成模型、数据采样、模型评价等作了较为深入的阐述和解析,结合网络教育平台的2794篇学习刊物进行了主题发现和聚类实验,建立了包含3800个词项的词库,通过kmeans算法和合并向量算法(UVM)分两步解决了主题聚类问题.提出了文本挖掘实验的一般方法,并对层次聚类中文本距离的算法提出了改进.实验结果表明,该平台刊物的主题整体相似度比较好,但主题过于集中使得许多刊物的内容不具有辨识度,影响用户对主题的定位.

著录项

来源
《上海理工大学学报》 |2019年第3期|273-280306|共9页
作者
杨传春; 张冰雪; 李仁德; 郭强;
展开▼
作者单位

上海理工大学复杂系统科学研究中心;

上海 200093;

上海理工大学 MPA 教育中心;

上海 200093;

上海理工大学复杂系统科学研究中心;

上海 200093;

上海理工大学复杂系统科学研究中心;

上海 200093;

展开▼
原文格式 PDF
正文语种 chi
中图分类统计方法、计算方法;
关键词
LDA模型; 生成模型; 主题发现; 层次聚类; 文本挖掘;

相似文献

中文文献
外文文献
专利

1. 基于LDA模型的新冠肺炎疫情微博用户主题聚类图谱及主题传播路径研究 [J] . 张柳 ,王晰巍 ,黄博 . 情报学报 . 2021,第003期
2. 基于LDA主题模型的电子病历热点主题发现 [J] . 王国睿 ,张亚飞 ,尚有为 . 中华医学图书情报杂志 . 2021,第002期
3. 基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究 [J] . 张景 ,朱国宾 . 计算机科学 . 2018,第004期
4. 基于LDA模型和文本聚类的水族文献主题挖掘研究 [J] . 杨秀璋 . 现代计算机（专业版） . 2019,第005期
5. 基于Word2Vec和LDA主题模型的Web服务聚类方法 [J] . 肖巧翔 ,曹步清 ,张祥平 . 中南大学学报（自然科学版） . 2018,第012期
6. 基于隐主题分析和文本聚类的微博客新闻话题发现研究 [C] . 路荣 ,项亮 ,刘明荣 . 第六届全国信息检索学术会议 . 2010
7. 基于LDA模型与聚类的网络新闻热点话题发现研究 [A] . 万晓霞 . 2016

基于LDA模型的网络刊物主题发现与聚类

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅