首页> 中文期刊>计算机工程与应用 >一种基于最少出现文档频的文本特征提取方法

一种基于最少出现文档频的文本特征提取方法

     

摘要

Conventional methods of text feature extraction are inadequate at distribution quantification, which to a large extent affects the efficiency of classification. Aiming at this problem, a scheme of Least Document Frequency (LDF) is proposed, which can quantify the concentration and dispersion among feature classes through LDF, thus can reflect the characteristics of the distribution more accurately. Through experiments, TF-LDF algorithm can ac-quire a better result.%传统特征提取改进方法在特征分布信息的量化方面存在不足,很大程度上影响了其分类效能.针对这一问题,提出一种基于最少出现文档频的特征提取改进方法,即TF-LDF算法.该算法用最少出现文档频来量化特征类间集中度与类内离散度,能够更加准确地反映特征分布情况.通过实验结果比较,可以证明TF-LDF算法分类效果更佳.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号