首页> 外文会议>International Conference on Internet Technology and Applications >一种基于生成树文档聚类改进的KNN文本分类方法
【24h】

一种基于生成树文档聚类改进的KNN文本分类方法

机译:一种基于生成树文档聚类改进的KNN文本分类方法

获取原文

摘要

针对KNN方法分类时效率不高,同时最佳参数K值难以确定的不足点,文中提出一种基于生成树文档聚类改进的KNN文本分类方法。其基本思想是使用生成树算法实现类内训练样本自动聚类,对生成的每R生成子树进行剪裁保留其核心文档节点,并将核心文档结点文档合并为一个中心文档。分类测试时,只需计算被测文档与子树中心文档的相似度:被测文档的类别为相似度最大的子树的类别。实验表明,文中方法与KNN方法相比有很好的分类稳定性,同时提高了分类的速度和避免了参数K值的选择。
机译:针对KNN方法分类时效率不高,同时最佳参数K值难以确定的不足点,文中提出一种基于生成树文档聚类改进的KNN文本分类方法。其基本思想是使用生成树算法实现类内训练样本自动聚类,对生成的每R生成子树进行剪裁保留其核心文档节点,并将核心文档结点文档合并为一个中心文档。分类测试时,只需计算被测文档与子树中心文档的相似度:被测文档的类别为相似度最大的子树的类别。实验表明,文中方法与KNN方法相比有很好的分类稳定性,同时提高了分类的速度和避免了参数K值的选择。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号