个人微博中公共事件检测算法的研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

伴随着计算机应用技术的迅猛发展,互联网传媒也相应地的兴起并快速地影响着人们的日常生活,与此同时成为了电视、报纸和广播等多种传统媒体之后的又一个新闻载体。由于信息能够在互联网空间内实现快速传播,其信息本身也呈现出了多元化、公开化和实时化特征,因此互联网充当了社会实时热点事件传播平台的重要角色。
　　以新浪微博为典型代表,是国内近年来新兴起且发展迅速的网络媒体。用户可以通过 WEB网页、移动客户端等多种途径随时随地进行状态更新和信息分享。新浪是目前国内流行度最广、用户规模最大的微博网站,根据2013年7月最新的数据统计显示,新浪微博注册用户已达到3.3亿,形成了微博庞大的数据量。
　　由于微博数据具有不规则性、海量性和实时性等特点。所以如何从大量的、不规则的个人微博数据中精确地提取出用户在某段时间内所关注公共事件,是当前个人微博信息检测技术首要解决的问题。
　　将个人微博数据作为实验测试样本,主要的研究工作是如何根据个人微博信息检测出某用户在某段时间内关注了哪些公共事件。经过反复地实验证明,将传统的事件提取算法应用于个人微博事件处理结果并不理想。所以在一系列算法尝试和多次实验的基础上,综合考虑了个人微博的非主流文本特征,以短文本数据挖掘为研究背景,以提取主题词为课题重点,展开了从文本获取、预处理、相似性度量,特征值计算、以及最后的公共模板的正向匹配和反向匹配等一系列研究。
　　课题已经形成了一个合理的、完整的个人微博公共事件检测的操作流程,概括起来主要分为文本预处理、主题词识别和公共模板匹配三个模块。具体说预处理主要是清除文本的噪音干扰,使得文本的表示方式更加规范化;主题词主要是基于耦合、时序和流行三个相似度的计算以及应用提出的TF-DF函数二者相结合的方法进行提取,这样不仅考虑了实验的数据特征,同时也提高了主题词提取的准确率;公共模版匹配通过主题词与新浪风云榜的模板事件依次进行正向匹配和反向匹配两个步骤,得到最终的公共事件检测结果。

著录项

作者
周环宇;
展开▼
作者单位

内蒙古科技大学;

展开▼
授予单位内蒙古科技大学;
学科计算机技术
授予学位硕士
导师姓名胡文江;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类蜂窝式移动通信系统（大哥大、移动电话手机）;
关键词
个人微博; 公共事件检测; 模版匹配; 互联网传媒; 事件提取算法;

相似文献

中文文献
外文文献
专利

1. 公共事件中微博意见领袖的话语策略与文本框架——基于新浪微博的实证研究 [J] . 芦何秋 ,杨泽亚 . 湖北大学学报（哲学社会科学版） . 2013,第005期
2. 公共事件传播中的微博参与情况探析——基于新浪财经“315微博投诉”案例的量化研究 [J] . 赵淼 ,孙亚靖 . 东南传播 . 2012,第012期
3. 重大公共事件中媒体官方微博的舆情传播研究 [J] . 何婷 ,冯锐 . 今传媒（学术版） . 2021,第003期
4. 突发公共事件中的短视频谣言研究——基于微博辟谣平台的谣言样本分析 [J] . 陈思媛 ,林佳议 ,刘思雅 . 新闻研究导刊 . 2021,第021期
5. 突发公共事件中微博的传播特点研究 [J] . 匡宇英 . 传媒论坛 . 2020,第010期
6. 政法机关工作人员个人微博管理策略实证研究——以新浪微博"中一在线"为例 [C] . 陈路坤 . 首届中国新闻法治建设学术峰会 . 2013
7. 突发公共事件的微博传播研究——以新浪微博对“什邡事件”的传播为例 [A] . 文辉 . 2014

个人微博中公共事件检测算法的研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅