首页> 中文期刊> 《中国索引》 >基于词频与改进余弦相似算法的主题挖掘及其在索引编制中的应用研究

基于词频与改进余弦相似算法的主题挖掘及其在索引编制中的应用研究

         

摘要

对余弦相似算法进行研究与改进得到FreqCosine算法,结合FreqCosine算法与词频两个维度,尝试对一般性文本进行主题挖掘研究并通过Python进行编程与实例测试,为文本分析提供方法与借鉴。通过FreqCosine算法与词频结合的分析方法,提炼和分析一般性文本的主题取得了较好的实际应用效果,能够更高效地挖掘出文本的主题内容。进一步利用挖掘出的主题内容编制倒排索引,可以大大降低倒排表的规模,提高查询效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号