首页> 中文期刊>计算机应用研究 >基于特征本体的文本流主题检测研究

基于特征本体的文本流主题检测研究

     

摘要

传统的主题检测方法以统计理论为基础,忽略了数据本身蕴涵的语义,带来了偏差严重、与样本数据高度相关等缺点.针对以上缺点,面向文本流数据,提出一种基于特征本体的主题检测方法.首先构建文本特征本体;其次,将较为复杂的文本特征本体看做是由若干主题组成的连通图,然后将主题连通图分解成单边图集合;再次,将主题相似度计算问题转换为单边图贡献度和图相似度的计算问题;最后,对每一批新文本集检测是否有新主题,从而使得主题的个数随着时间的推移而增加.在科技文献和新闻语料上进行实证研究,结果发现阈值δ参数决定文本流中新主题出现的频率,且实验结果同经典主题模型基本保持一致.除此之外,同传统的方法相比,提出的方法能更好地支持主题的语义表示,且适用于流数据,能增量实现主题检测,在应用上具有更大的优势.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号