首页> 外文OA文献 >Research on Hot Words Discovery and Clustering Algorithm Based on Rules and Statistics
【2h】

Research on Hot Words Discovery and Clustering Algorithm Based on Rules and Statistics

机译:基于规则和统计的热词发现与聚类算法研究

摘要

热点词汇(以下简称热词)是一种普遍的网络词汇现象,反映了特定一段时间内人们普遍关注的问题,对热词进行快速识别和定向跟踪,可以快速地了解民情、了解社会动态和发展趋势,更快捷更准确地抓住舆论导向,从而进行正确地引导和宣传。因此,如何挖掘热点词汇将是中文信息处理中的一个重要研究课题。 目前,对于热词的检测方法总体可以分为两大类:基于规则和基于统计。基于规则的方法的优点是准确率高,但灵活性差,规则维护困难;基于统计的方法的优点是灵活性好,可移植性强,但需要对大规模语料进行训练,会产生大量的垃圾串,准确率并不是很高。因此本文提出了一种基于规则和统计相结合的热点词汇发现方法,并在此基础上建立热点词汇搜索...
机译:热点词汇(以下简称热词)是一种普遍的网络词汇现象,反映了特定一段时间内人们普遍关注的问题,对热词进行快速识别和定向跟踪,可以快速地了解民情、了解社会动态和发展趋势,更快捷更准确地抓住舆论导向,从而进行正确地引导和宣传。因此,如何挖掘热点词汇将是中文信息处理中的一个重要研究课题。 目前,对于热词的检测方法总体可以分为两大类:基于规则和基于统计。基于规则的方法的优点是准确率高,但灵活性差,规则维护困难;基于统计的方法的优点是灵活性好,可移植性强,但需要对大规模语料进行训练,会产生大量的垃圾串,准确率并不是很高。因此本文提出了一种基于规则和统计相结合的热点词汇发现方法,并在此基础上建立热点词汇搜索...

著录项

  • 作者

    连晓轩;

  • 作者单位
  • 年度 2013
  • 总页数
  • 原文格式 PDF
  • 正文语种 zh_CN
  • 中图分类
  • 入库时间 2022-08-20 20:14:00

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号