短信息的会话检测及组织

田野; 王文东; 饶京海; 王冠; 郭亮; 陈灿峰; 马建

首页> 中文期刊>软件学报 >短信息的会话检测及组织

短信息的会话检测及组织

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

如何挖掘存储在手机上的大量短信息背后所隐含的会话信息,是一个非常具有挑战性的问题,因为它们并不具备“主题”、“回复”等经常被用于邮件线索分析的元数据.基于此,提出了一种基于时间聚类算法和话题检测的短信息会话识别模型.首先,根据短信息流的时间分布特性,将会话双方的所有短信息划分到一个一个的候选会话中,进而运用基于latent Dirichlet allocation(LDA)训练出来的语义话题模型,对候选会话进行更深层次的分析 ;利用该话题模型度量了各个候选会话在话题上的相关度.最后,在综合时间和话题相关度的基础上,通过对候选会话的合并识别出隐含的会话信息.通过对包含了50名大学生在6个月中产生的122 359条短信进行实验验证,证明了该算法的有效性.%Mining the latent conversations which are implied in the big amount of text messages stored on one's mobile phone, is a challenging problem. They can hardly be organized by threads, due to lack of necessary metadata such as "subject" and "reply-to". This paper proposes an innovative conversation recognition model based on temporal clustering algorithms and topic detection methods. The study first clusters the text messages into candidate conversations based on their temporal attributes, and then does further analysis using a semantic model based on latent Dirichlet allocation (LDA). In the end, the text messages are organized as conversations based on their integrated correlation of temporal relevancy and topic relevancy. This approach is evaluated with a real dataset, which contain 122 359 text messages collected from 50 University students during 6 months.

著录项

来源
《软件学报》|2012年第10期|2586-2599|共14页
作者
田野; 王文东; 饶京海; 王冠; 郭亮; 陈灿峰; 马建;
展开▼
作者单位

网络与交换国家重点实验室(北京邮电大学),北京 100876;

网络与交换国家重点实验室(北京邮电大学),北京 100876;

诺基亚研究院,北京 100176;

网络与交换国家重点实验室(北京邮电大学),北京 100876;

网络与交换国家重点实验室(北京邮电大学),北京 100876;

诺基亚研究院,北京 100176;

网络与交换国家重点实验室(北京邮电大学),北京 100876;

无锡物联网产业研究院,江苏无锡214135;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
短信息; 时间聚类; 话题; latent Dirichlet allocation;

相似文献

中文文献
外文文献
专利

1. 网上短信息资源的组织管理 [J] . 郭春侠 ,郭卫华 ,储节旺 . 现代情报 . 2006,第002期
2. 基于手机短信息的老年人跌倒检测装置 [J] . 赵如如 ,吴海翔 ,游苗苗 . 医疗卫生装备 . 2012,第003期
3. 高职康复专业“手语会话”教学组织模式改革探索 [J] . 张墨 ,范才增 . 重庆电子工程职业学院学报 . 2015,第003期
4. 亲子阅读中成幼问答式会话序列组织结构分析 [J] . 王俊卿1 . 教育进展 . 2015,第005期
5. 英语日常会话毗邻双部结构的“可取”组织 [J] . 黄衍 . 现代外语 . 1987,第3期
6. 基于控制会话稳定性的P2P僵尸主机检测 [C] . 唐亮 ,李芝棠 ,李冬 . 中国教育和科研计算机网CERNET第十六届学术年会 . 2009
7. 基于短信息（SMS）的移动电子商务——购物短信息服务平台的设计和实现 [A] . 林国勇 . 2003

短信息的会话检测及组织

摘要

著录项

相似文献

相关主题

期刊订阅