首页> 中文期刊>计算机工程 >基于贝叶斯信息准则的文本主题数估计

基于贝叶斯信息准则的文本主题数估计

     

摘要

特定领域的主题识别和关键词提取有着广泛的应用,但通过人工指定识别或文本聚类自动生成的主题类别缺乏客观的度量方法.该文结合基于BIC准则的模型选择理论和独立分量分析技术对主题的数量进行概率估计,给出主题数量在BIC意义下的统计分布.在此基础上实现了文档矩阵的ICA分解,并根据分离的独立分量获得主题的关键词及其权重.实验表明,该方法在没有领域知识支持的情况下能估计出反映文本集合的主题数并提取相应的关键词.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号