【24h】

Topic Chains for Understanding a News Corpus

机译:了解新闻语料库的主题链

获取原文

摘要

The Web is a great resource and archive of news articles for the world. We present a framework, based on probabilistic topic modeling, for uncovering the meaningful structure and trends of important topics and issues hidden within the news archives on the Web. Central in the framework is a topic chain, a temporal organization of similar topics. We experimented with various topic similarity metrics and present our insights on how best to construct topic chains. We discuss how to interpret the topic chains to understand the news corpus by looking at long-term topics, temporary issues, and shifts of focus in the topic chains. We applied our framework to nine months of Korean Web news corpus and present our findings.
机译:Web是一个很好的资源,是世界各地新闻文章的档案库。我们提出了一个基于概率主题建模的框架,该框架用于揭示Web新闻档案库中隐藏的重要主题和问题的有意义的结构和趋势。框架的中心是一个主题链,一个类似主题的时间组织。我们对各种主题相似性指标进行了实验,并提出了关于如何最好地构建主题链的见解。我们讨论如何通过查看长期话题,暂时性问题以及话题链中的焦点转移来解释话题链以理解新闻语料库。我们将框架应用于9个月的韩国网络新闻语料库,并提出了我们的发现。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号