首页> 中文学位 >热点新闻点击量预测及话题演化算法研究
【6h】

热点新闻点击量预测及话题演化算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 研究现状

1.2.1 热点新闻点击量趋势预测

1.2.2 新闻话题演化脉络挖掘

1.3 本文的主要研究思路和创新点

1.3.1 基于算法融合策略的新闻点击量预测算法

1.3.2 基于多源语义特征和多标签分类模型的新闻话题演化挖掘算法

1.4 本文的组织架构

第二章 极限学习机和灰色模型融合的新闻点击量预测

2.1 引言

2.2 热点新闻点击量预测整体方案

2.2.1 Grey verhulst模型

2.2.2 极限学习机

2.3 基于GV-ELM模型的点击量预测算法

2.4 实验结果与分析

2.4.1 实验数据及评价指标

2.4.2 实验结果与分析

2.5 本章小结

第三章 面向话题演化的新闻配图和文本特征表示

3.1 引言

3.2 图像特征提取

3.2.1 浅语义图像特征提取

3.2.2 深语义图像特征提取——卷积神经网络

3.3 新闻特征表示的整体方案

3.4 配图语义特征抽取算法

3.4.1 配图抽象特征

3.4.2 配图语义特征

3.4.3 网络的实现

3.5 实验结果与分析

3.5.1 实验数据及评价指标

3.5.2 实验结果与分析

3.6 本章小结

第四章 基于多标签分类的话题演化算法研究

4.1 引言

4.2 新闻话题演化脉络挖掘整体方案

4.3 多标签分类算法

4.4 实验结果与分析

4.4.1 实验数据及事件链性能评估指标

4.4.2 实验结果与分析

4.5 本章小结

总结与展望

参考文献

致谢

攻读硕士学位期间取得的科研成果

展开▼

摘要

在舆论自由的背景下,热点新闻更易成为公众议论的集中点和矛盾爆发点,预测热点新闻点击量,有助于政府和传媒工作者掌握事态发展趋势,提高对热点事件处理的主动性。同时,挖掘热点新闻话题演化轨迹能帮助公众更加快速全面地了解事件的演化轨迹,避免浅尝辄止和产生偏颇的观点。
  本文以新闻点击量预测和新闻演化脉络挖掘为研究重点,主要内容如下:
  (1)提出基于Grey Verhulst模型和极限学习机融合的新闻点击量预测算法;
  热点新闻点击量数据具有随机性和波动性,不利于后续准确的预测。本文提出的算法能够有效地过滤数据的随机波动噪声,同时保留数据分布规律,实验表明所提出的算法在新闻点击量预测上的平均准确率较其他算法提升了7%。
  (2)提出新闻配图和新闻文本的多源特征表示算法
  新闻的特征表示是挖掘新闻话题演化轨迹的首要步骤,虽然新闻配图包含大量与事件相关的信息,但相对新闻文本而言容易被忽略。本文构建了一种简约深度卷积神经网络模型,用分类概率值表征图像语义特征,将图像与文本特征结合,共同表示新闻。实验表明多源特征的分类准确率较使用单一文本特征提高了2.4%。
  (3)提出基于多标签分类的新闻演化轨迹挖掘算法
  在新闻演化过程中,新闻之间具有相互关联和时间紧邻的特点,建立t时刻和t+1时刻的新闻相似性度量模型是演化轨迹挖掘的核心。本文提出基于多标签分类模型的脉络挖掘方法,将标签共现作为新闻相似性度量的依据。实验表明获取的新闻话题演化脉络有较好的逻辑性,易于理解。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号