首页> 中文期刊> 《计算机工程》 >重复串特征提取算法及其在文本聚类中的应用

重复串特征提取算法及其在文本聚类中的应用

         

摘要

针对Web文档的高维问题及网络新语言给现有分词系统带来的挑战,该文提出一种基于重复串的特征提取方法,可以从文本中提取有意义的特征,且对于中文无需分词.实验表明,该方法可以降低特征空间维度,同时能有效改善传统以词为特征的聚类算法的性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号