话题检测
话题检测的相关文献在2003年到2022年内共计209篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术
等领域,其中期刊论文104篇、会议论文8篇、专利文献1104793篇;相关期刊64种,包括郑州大学学报(理学版)、计算机工程、计算机科学等;
相关会议8种,包括2013年中国教育和科研计算机网第20届学术会议、第四届国际应急管理论坛暨中国(双法)应急管理专业委员会第五届年会、第四届全国信息检索与内容安全学术会议等;话题检测的相关文献由467位作者贡献,包括程学旗、刘悦、廖祥文等。
话题检测—发文量
专利文献>
论文:1104793篇
占比:99.99%
总计:1104905篇
话题检测
-研究学者
- 程学旗
- 刘悦
- 廖祥文
- 陈国龙
- 刘磊
- 杨定达
- 王丽宏
- 贺敏
- 丁丽
- 云晓春
- 包秀国
- 周勇林
- 夏春艳
- 李树平
- 王海舟
- 赵铁军
- 陈兴蜀
- 马宏远
- 于健
- 于瑞国
- 刘玮
- 吴天博
- 吴旭
- 唐瑞
- 喻梅
- 夏云庆
- 庞卫巍
- 张丹
- 张勇东
- 张小明
- 李舟军
- 杜军平
- 杜攀
- 杨建武
- 杨武
- 殷明刚
- 江颉
- 洪宇
- 王健宗
- 王小号
- 王敏杰
- 王文贤
- 秦姣华
- 蒋梦婷
- 薛哲
- 谭骏珊
- 赵丽
- 赵华
- 赵立永
- 陈春旭
-
-
徐菲菲;
陈赛红;
田宇
-
-
摘要:
随着网络中出现大量的新闻内容,如何在短期内为用户及时发现新闻热点话题越来越受到学者们的关注。提出一种基于BTM模型和改进K-Means聚类算法的中文新闻话题检测模型。对网易新闻语料库引入BTM模型,发现与主题相关的话题词,从而推断热点话题;针对K-Means算法初始值敏感等问题,将基于共轭梯度的人工鱼群算法引入传统的K-Means算法;利用改进K-Means聚类算法对得到的话题词进行聚类。实验结果表明,所提方法与传统方法相比可有效、准确提高话题的准确性。
-
-
李丽蓉
-
-
摘要:
话题检测技术可以及时发现网络舆情热点话题和突发性事件,可以持续跟踪话题,实时掌握网络舆情事件的动向。文本聚类算法是实现话题检测与跟踪的重要方法,传统K-Means聚类算法结构简单,收敛速度快,但存在对初始聚类中心选择敏感、容易陷入局部最优解等局限。引入差分进化算法对K-Means算法进行改进,既具有差分进化算法的全局优化能力,又保留了K-Means算法简单高效的优点,并兼顾了网络舆情话题检测的准确性和实时性。实验表明,改进后算法的误检率、漏检率和耗费函数都有明显改善,提高了话题检测准确度上的有效性和实用性。
-
-
李丽蓉
-
-
摘要:
话题检测技术可以及时发现网络舆情热点话题和突发性事件,可以持续跟踪话题,实时掌握网络舆情事件的动向.文本聚类算法是实现话题检测与跟踪的重要方法,传统K-Means 聚类算法结构简单,收敛速度快,但存在对初始聚类中心选择敏感、容易陷入局部最优解等局限.引入差分进化算法对K-Means 算法进行改进,既具有差分进化算法的全局优化能力,又保留了 K-Means 算法简单高效的优点,并兼顾了网络舆情话题检测的准确性和实时性.实验表明,改进后算法的误检率、漏检率和耗费函数都有明显改善,提高了话题检测准确度上的有效性和实用性.
-
-
吴旭;
陈春旭
-
-
摘要:
[目的]更好地解决群聊话题纠缠的问题,减少稀疏文本特征对聚类的影响,实现对多类型消息混合的连续群聊信息的话题检测.[方法]提出一种基于多策略的群聊话题检测技术,通过构建话题序列解决话题交叉,利用消息的用户、时间、类型等属性提升聚类效果.[结果]本方法处理三份群聊记录样本的纯文本数据时的F值较对比算法分别提升2.9%、6.1%和3.0%,速度分别提高约27.6%、32.1%和47.1%.本方法还能处理传统算法无法应对的混合类型数据,且比处理对应的纯文本数据时的性能分别提升约29.4%、27.1%和22.5%.[局限]对群聊消息文本特征的利用率不足,算法所设阈值过多.[结论]本文方法能够在一定程度上提高群聊话题检测效果,并扩大了话题检测所能应对的消息类型的广度,提升了舆情分析效率.
-
-
吴旭;
陈春旭
-
-
摘要:
【目的】更好地解决群聊话题纠缠的问题,减少稀疏文本特征对聚类的影响,实现对多类型消息混合的连续群聊信息的话题检测。【方法】提出一种基于多策略的群聊话题检测技术,通过构建话题序列解决话题交叉,利用消息的用户、时间、类型等属性提升聚类效果。【结果】本方法处理三份群聊记录样本的纯文本数据时的F值较对比算法分别提升2.9%、6.1%和3.0%,速度分别提高约27.6%、32.1%和47.1%。本方法还能处理传统算法无法应对的混合类型数据,且比处理对应的纯文本数据时的性能分别提升约29.4%、27.1%和22.5%。【局限】对群聊消息文本特征的利用率不足,算法所设阈值过多。【结论】本文方法能够在一定程度上提高群聊话题检测效果,并扩大了话题检测所能应对的消息类型的广度,提升了舆情分析效率。
-
-
-
李丰男;
孟祥茹;
焦艳菲;
张琳琳;
刘念
-
-
摘要:
当今时代,网络舆情传播速度快、影响力大,而话题检测在网络舆情监管中有着不可替代的作用.针对传统方法提取文本特征不完整和特征维度过高的问题,本文提出了基于时间衰减因子的LDA&&Word2Vec文本表示模型,将LDA模型的隐含主题特征和Word2Vec模型的语义特征进行加权融合,并引入了时间衰减因子,同时起到了降维和提高文本特征完整度的作用.同时,本文又提出了Single-Pass-SOM组合聚类模型,该模型解决了SOM模型需要设定初始神经元的问题,提高了话题聚类的精度.实验结果表明,本文提出的文本表示模型和文本聚类方法较传统方法拥有更好的话题检测效果.
-
-
谭梦婕;
吕鑫;
陶飞飞
-
-
摘要:
In order to help investors find hot spots of investment in a short time, this paper combines the characteristics of the financial news and proposes a financial news topic detection model.The model constructs a time window based on financial news to segment news streams, combines the topic events, feature words, news semantics and financial name entities to extract text features, and applies the Nearest Neighbor-Hierarchical Agglomerative Clustering (NNHAC) algorithm to get the topic clusters.Experimental results show that, compared with tranditional multi-feature topic detection models, this model can effectively reduce the running time of the clustering algorithm, improve the accuracy of topic detection, and to a certain extent, it helps investors to make decision and judgement.%为辅助投资者在短期内及时发现投资热点, 结合财经新闻的特点, 提出一种财经新闻话题检测模型.构建基于财经新闻的时间窗切分新闻流, 根据新闻文本中的主题事件、特征词、新闻语义及金融命名实体提取文本特征, 并应用最近邻-凝聚层次聚类算法获得话题簇.实验结果表明, 与传统多特征话题检测模型相比, 该模型可有效降低聚类算法运行时间, 提高话题检测准确度, 且在一定程度上协助投资者进行决策判断.
-
-
张文博;
米成刚;
杨雅婷
-
-
摘要:
针对传统话题检测方法得到的结果和实际话题个数相差较大的缺点,根据话题所包含的文本数对话题之间的相似度进行衰减,进而优先合并粒度较小类,并根据文档话题频率和权重对较大的话题向量进行降维,通过这两方面对传统的层次聚类方法进行改进.同时为了更好地表达话题的语义信息,使用在句子中共现的词对向量来取代传统的向量空间模型.实验结果表明,使用词对模型和改进的方法可以取得更好的效果,而且得到的聚类结果和实际话题个数相近.
-
-
-
-
-
- 《第四届全国信息检索与内容安全学术会议》
| 2008年
-
摘要:
文档聚类是实现话题检测与跟踪的重要方法.传统的硬聚类算法在处理边界数据时存在很大缺陷,影响话题检测的效果.针对这一问题,本文提出一种改进的基于容错粗糙集的聚类方法,利用某些文档特征项协同出现,构造特征项容错关系,扩充特征项的描述能力,最后用特征项容错类描述文档之间的相似关系,实现了话题检测与跟踪的过程.实验证明,该方法能够有效的处理边界数据,提高文本聚类的效果.
-
-
李燕军;
路斌;
杨建武
- 《第二十二届全国计算机安全学术交流会》
| 2007年
-
摘要:
话题检测与追踪技术是一种面向信息安全的技术,可以被广泛应用于信息安全的信息内容对抗层面,特别是对解决舆情挖掘与信息内容安全预警有着现实意义。本文针对信息安全中的舆情挖掘和预警需求,介绍TDT技术的研究现状以及TDT如何在信息安全领域得到应用,并针对未来的发展前景做出展望。
-
-
-
- 《第十四届全国图象图形学学术会议》
| 2008年
-
摘要:
本文设计了一种基于关键词识别和主题检测的智能家庭普适计算系统.它是把自然语言处理中的关键词识别和主题检测技术与普适计算相结合完成的系统,它就像一个智能机器人一样,第一时间内从用户的话语中了解到用户的真正意图,依照用户意图为用户提供恰当的服务.系统通过捕捉用户话语中的关键词,利用主题检测技术锁定用户的意图和情绪,针对用户的意图联合普适家庭设备实现该系统的功能.如系统检测到王先生的话语主题为"足球",并且希望看到或听到与足球相关的报道,系统便搜索到足球相关频道提供给王先生.这个系统采集语音输入信号,计算其MFCC参数作为特征参数,在关键词识别中采用了隐马尔科夫模型,在主题检测中则采用了基于双质心话题模型的话题检测算法.
-
-
-
郑伟;
张宇;
邹博伟;
洪宇;
刘挺
- 《第九届全国计算语言学学术会议》
| 2007年
-
摘要:
作为话题检测与跟踪的重要研究子课题,话题跟踪针对特定话题,识别后续信息流中的相关报道。针对话题本身的漂移现象,本文基于改进的相关性模型,对跟踪中伪相关反馈包含的新颖信息进行检测和建模,并在此基础上动态调整话题空间,跟踪话题漂移,降低漏检率。实验采用TDT4语料中文资源及TDT2003的评测标准,结果验证此方法可以有效地改进话题跟踪的效果。