您现在的位置: 首页> 研究主题> 话题检测

话题检测

话题检测的相关文献在2003年到2022年内共计209篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术 等领域,其中期刊论文104篇、会议论文8篇、专利文献1104793篇;相关期刊64种,包括郑州大学学报(理学版)、计算机工程、计算机科学等; 相关会议8种,包括2013年中国教育和科研计算机网第20届学术会议、第四届国际应急管理论坛暨中国(双法)应急管理专业委员会第五届年会、第四届全国信息检索与内容安全学术会议等;话题检测的相关文献由467位作者贡献,包括程学旗、刘悦、廖祥文等。

话题检测—发文量

期刊论文>

论文:104 占比:0.01%

会议论文>

论文:8 占比:0.00%

专利文献>

论文:1104793 占比:99.99%

总计:1104905篇

话题检测—发文趋势图

话题检测

-研究学者

  • 程学旗
  • 刘悦
  • 廖祥文
  • 陈国龙
  • 刘磊
  • 杨定达
  • 王丽宏
  • 贺敏
  • 丁丽
  • 云晓春
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 徐菲菲; 陈赛红; 田宇
    • 摘要: 随着网络中出现大量的新闻内容,如何在短期内为用户及时发现新闻热点话题越来越受到学者们的关注。提出一种基于BTM模型和改进K-Means聚类算法的中文新闻话题检测模型。对网易新闻语料库引入BTM模型,发现与主题相关的话题词,从而推断热点话题;针对K-Means算法初始值敏感等问题,将基于共轭梯度的人工鱼群算法引入传统的K-Means算法;利用改进K-Means聚类算法对得到的话题词进行聚类。实验结果表明,所提方法与传统方法相比可有效、准确提高话题的准确性。
    • 李丽蓉
    • 摘要: 话题检测技术可以及时发现网络舆情热点话题和突发性事件,可以持续跟踪话题,实时掌握网络舆情事件的动向。文本聚类算法是实现话题检测与跟踪的重要方法,传统K-Means聚类算法结构简单,收敛速度快,但存在对初始聚类中心选择敏感、容易陷入局部最优解等局限。引入差分进化算法对K-Means算法进行改进,既具有差分进化算法的全局优化能力,又保留了K-Means算法简单高效的优点,并兼顾了网络舆情话题检测的准确性和实时性。实验表明,改进后算法的误检率、漏检率和耗费函数都有明显改善,提高了话题检测准确度上的有效性和实用性。
    • 李丽蓉
    • 摘要: 话题检测技术可以及时发现网络舆情热点话题和突发性事件,可以持续跟踪话题,实时掌握网络舆情事件的动向.文本聚类算法是实现话题检测与跟踪的重要方法,传统K-Means 聚类算法结构简单,收敛速度快,但存在对初始聚类中心选择敏感、容易陷入局部最优解等局限.引入差分进化算法对K-Means 算法进行改进,既具有差分进化算法的全局优化能力,又保留了 K-Means 算法简单高效的优点,并兼顾了网络舆情话题检测的准确性和实时性.实验表明,改进后算法的误检率、漏检率和耗费函数都有明显改善,提高了话题检测准确度上的有效性和实用性.
    • 吴旭; 陈春旭
    • 摘要: [目的]更好地解决群聊话题纠缠的问题,减少稀疏文本特征对聚类的影响,实现对多类型消息混合的连续群聊信息的话题检测.[方法]提出一种基于多策略的群聊话题检测技术,通过构建话题序列解决话题交叉,利用消息的用户、时间、类型等属性提升聚类效果.[结果]本方法处理三份群聊记录样本的纯文本数据时的F值较对比算法分别提升2.9%、6.1%和3.0%,速度分别提高约27.6%、32.1%和47.1%.本方法还能处理传统算法无法应对的混合类型数据,且比处理对应的纯文本数据时的性能分别提升约29.4%、27.1%和22.5%.[局限]对群聊消息文本特征的利用率不足,算法所设阈值过多.[结论]本文方法能够在一定程度上提高群聊话题检测效果,并扩大了话题检测所能应对的消息类型的广度,提升了舆情分析效率.
    • 吴旭; 陈春旭
    • 摘要: 【目的】更好地解决群聊话题纠缠的问题,减少稀疏文本特征对聚类的影响,实现对多类型消息混合的连续群聊信息的话题检测。【方法】提出一种基于多策略的群聊话题检测技术,通过构建话题序列解决话题交叉,利用消息的用户、时间、类型等属性提升聚类效果。【结果】本方法处理三份群聊记录样本的纯文本数据时的F值较对比算法分别提升2.9%、6.1%和3.0%,速度分别提高约27.6%、32.1%和47.1%。本方法还能处理传统算法无法应对的混合类型数据,且比处理对应的纯文本数据时的性能分别提升约29.4%、27.1%和22.5%。【局限】对群聊消息文本特征的利用率不足,算法所设阈值过多。【结论】本文方法能够在一定程度上提高群聊话题检测效果,并扩大了话题检测所能应对的消息类型的广度,提升了舆情分析效率。
    • 李丰男; 孟祥茹; 焦艳菲; 张琳琳; 刘念
    • 摘要: 当今时代,网络舆情传播速度快、影响力大,而话题检测在网络舆情监管中有着不可替代的作用.针对传统方法提取文本特征不完整和特征维度过高的问题,本文提出了基于时间衰减因子的LDA&&Word2Vec文本表示模型,将LDA模型的隐含主题特征和Word2Vec模型的语义特征进行加权融合,并引入了时间衰减因子,同时起到了降维和提高文本特征完整度的作用.同时,本文又提出了Single-Pass-SOM组合聚类模型,该模型解决了SOM模型需要设定初始神经元的问题,提高了话题聚类的精度.实验结果表明,本文提出的文本表示模型和文本聚类方法较传统方法拥有更好的话题检测效果.
    • 谭梦婕; 吕鑫; 陶飞飞
    • 摘要: In order to help investors find hot spots of investment in a short time, this paper combines the characteristics of the financial news and proposes a financial news topic detection model.The model constructs a time window based on financial news to segment news streams, combines the topic events, feature words, news semantics and financial name entities to extract text features, and applies the Nearest Neighbor-Hierarchical Agglomerative Clustering (NNHAC) algorithm to get the topic clusters.Experimental results show that, compared with tranditional multi-feature topic detection models, this model can effectively reduce the running time of the clustering algorithm, improve the accuracy of topic detection, and to a certain extent, it helps investors to make decision and judgement.%为辅助投资者在短期内及时发现投资热点, 结合财经新闻的特点, 提出一种财经新闻话题检测模型.构建基于财经新闻的时间窗切分新闻流, 根据新闻文本中的主题事件、特征词、新闻语义及金融命名实体提取文本特征, 并应用最近邻-凝聚层次聚类算法获得话题簇.实验结果表明, 与传统多特征话题检测模型相比, 该模型可有效降低聚类算法运行时间, 提高话题检测准确度, 且在一定程度上协助投资者进行决策判断.
    • 张文博; 米成刚; 杨雅婷
    • 摘要: 针对传统话题检测方法得到的结果和实际话题个数相差较大的缺点,根据话题所包含的文本数对话题之间的相似度进行衰减,进而优先合并粒度较小类,并根据文档话题频率和权重对较大的话题向量进行降维,通过这两方面对传统的层次聚类方法进行改进.同时为了更好地表达话题的语义信息,使用在句子中共现的词对向量来取代传统的向量空间模型.实验结果表明,使用词对模型和改进的方法可以取得更好的效果,而且得到的聚类结果和实际话题个数相近.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号