基于主题模型的Twitter事件检测

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着Twitter等社交网络应用的迅速发展,越来越多的用户在上面发布实时信息、更新个人状态、表达自己的观点想法等。Twitter上的事件检测逐渐成为一个热门的研究话题,吸引了越来越多学者的关注。虽然 Twitter上的数据相对于传统的新闻媒体、网络博客等数据有更新实时、覆盖范围广、用户参与度高等优点,但是Tweets数据的单条信息量少、噪音大、更新频繁、总数据量大等特点也给事件检测带来了很大的挑战。
　　本文提出一种基于主题模型的 Twitter事件检测算法 GEAM(General and Event-related Aspects Model),该模型通过模拟一条与现实事件相关的Tweet的生成过程将Tweet中描述事件相关方面的词项(Event-related Aspects words)和与事件无关的常用词项(General words)区分开来。同时,我们也提出Collapsed Gibbs Sampling算法对GEAM模型进行估计和推理,以得到描述不同事件的词项分布。此外,我们还提出了GEAM模型的在线式变形算法,实时检测连续的Tweets数据流中产生的事件并且追踪该事件的演化过程。
　　本文设计了一系列的实验用以评估 GEAM模型的有效性。大规模真实Tweets数据集(超过6百万条Tweets)上的实验表明,GEAM模型在查准率(Precision),查全率(Recall)和重复事件检测率(DERate)都优于传统LDA主题模型。GEAM模型采用(时间,地点,实体,核心词)四元组的形式表示事件的细粒度信息,使得事件检测结果的语义更为清晰。此外,实验部分还展示了在线式 GEAM 模型追踪事件演变过程的能力。

著录项

作者
尤玥;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科计算机科学与技术
授予学位硕士
导师姓名曹健;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
事件检测; 检测算法; 演化过程; 事件追踪;

相似文献

中文文献
外文文献
专利

1. 基于主题模型的网络流通渠道服务质量分析与评价体系研究 [J] . 张浩 ,王婷 . 物流科技 . 2022,第1期
2. 疫情过后线上办公APP如何留住人心?――基于LDA主题模型的用户需求分析 [J] . 冯晨 ,周亲 ,李亚红 . 软件 . 2021,第003期
3. 基于语义增强的短文本主题模型 [J] . 高娟 ,张晓滨 . 计算机系统应用 . 2021,第006期
4. 基于LDA主题模型的电子病历热点主题发现 [J] . 王国睿 ,张亚飞 ,尚有为 . 中华医学图书情报杂志 . 2021,第002期
5. 基于LDA主题模型的形势与政策教育创新实践 [J] . 马梦祥 . 西部学刊 . 2021,第010期
6. 基于主题模型的古典乐器诗词文本挖掘 [C] . SHEN Zizhuo ,申资卓 ,YANG Ying . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于主题模型和社区发现的微博热点事件检测研究 [A] . 张志瑛 . 2014

基于主题模型的Twitter事件检测

目录

摘要

著录项

相似文献

相关主题

期刊订阅