首页> 外文OA文献 >Text Categorization Method and Application Based on Improved KNN
【2h】

Text Categorization Method and Application Based on Improved KNN

机译:基于改进的KNN的文本分类方法及应用

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。本文研究了基于KNN(knearestneighbors)的文本分类方法,KNN方法作为一种简单、有效的分类方法,在文本分类中得到了广泛的应用。本文对多种传统的特征抽取方法进行了分析,并且对互信息和文档频率两种特征抽取方法进行了改进,提出了基于互信息和文档频数的组合特征抽取方法,该方法过滤掉了无关的低频词和类间分布差异不大的词条,减小了分类的噪音。通过对常用的特征权重计算方法TF-IDF的分析后,提出了一种新的权值计算方法TF-WET。该权值计算方法将特征评估函数包含到特征权值计算中,按照特征对文本分类的辨别能力调整其在权重计...
机译:随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。本文研究了基于KNN(knearestneighbors)的文本分类方法,KNN方法作为一种简单、有效的分类方法,在文本分类中得到了广泛的应用。本文对多种传统的特征抽取方法进行了分析,并且对互信息和文档频率两种特征抽取方法进行了改进,提出了基于互信息和文档频数的组合特征抽取方法,该方法过滤掉了无关的低频词和类间分布差异不大的词条,减小了分类的噪音。通过对常用的特征权重计算方法TF-IDF的分析后,提出了一种新的权值计算方法TF-WET。该权值计算方法将特征评估函数包含到特征权值计算中,按照特征对文本分类的辨别能力调整其在权重计...

著录项

  • 作者

    李长虹;

  • 作者单位
  • 年度 2005
  • 总页数
  • 原文格式 PDF
  • 正文语种 zh_CN
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号