首页> 中文期刊> 《统计与决策》 >LDA最优主题数选取方法研究:以CNKI文献为例

LDA最优主题数选取方法研究:以CNKI文献为例

         

摘要

文章对LDA主题模型最优主题数确定方法进行了改进。选取CNKI学术期刊中关于政府补贴和企业创新相关的文献作为研究对象,运用观点挖掘和语义网络分析对作者态度和文献内容进行概览,采用困惑度-主题方差相结合的方法来确定文献的最优主题数,并利用基于LDA主题词提取的文献计量方法分析文献主题之间的相关关系。结果表明:"困惑度-主题方差"相结合的方法能够有效避免主题数选取的随意性和主观性,有益于集中提取出辨识度较高的主题,采用此方法分析文本资料更加精准、可信。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号