首页> 中文学位 >网络论坛话题补全与热度量化研究
【6h】

网络论坛话题补全与热度量化研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 研究背景与意义

1.2 研究现状

1.3 主要研究内容

1.4 论文的组织结构

第二章 基本概念与技术

2.1 网络话题

2.2 数据提取

2.3 中文分词技术

2.4 本章小结

第三章 网络论坛中话题补全技术

3.1 问题描述

3.2 检索模型

3.3 话题补全技术

3.4 本章小结

第四章 基于用户活跃程度的话题热度计算

4.1 热度量化问题

4.2 热度量化方法

4.3 实验和结果

4.4 本章小结

第五章 总结与展望

5.1 论文总结

5.2 未来工作展望

参考文献

攻读硕士期间发表的论文

致谢

展开▼

摘要

网络论坛中存在很多话题,通过这些话题可以了解当前社会的舆情,并可以对其进行监控,实施积极引导。对于相应的舆情监控系统,主要研究内容包括话题识别和话题监控。话题识别是对网络文本集进行处理,发现其中包含的话题类别,将文本集中的文本归入相应的类别。话题监控是对相关话题进行监测,并进行跟踪和控制。
  在网络话题识别方面,现有的研究中最重要、最基本的技术是文本分类和文本聚类。对于给定的一个话题,如果用分类或聚类的方法在文档集中得到相应的文本集合,无论是训练样本的学习还是聚类个数的给定,或者是决定类别粒度的阈值选取,在网络论坛的特殊情况下,其结果可能不能够很准确、全面地描述该话题。基于这些情况,文本提出了面向网络论坛的话题补全问题,并且实现了一种基于关键字的话题补全方法,使得用户可以根据给定的与某个话题相关的关键字对该话题进行较为全面的关键字补充。
  在话题热度计算方面,现有的研究都是对访问量、回复量、点击量等数据进行加权处理来计算相关话题的热度,这种方式下,权重的选取对最后的话题量化结果影响很大,对同样的话题、同样的数据取不同的权重计算出的热度数值会呈现出颠覆性的变化。本文根据这些情况提出基于用户活跃程度的话题热度计算方法,将用户在网络行为中的活跃程度作为计算网络话题受关注程度的指标。通过这种方法,可以比较有效地避免了由于少数用户关注程度大而造成的话题热度失真情况。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号