首页> 中国专利> 一种优化训练样本集的KNN文本分类方法

一种优化训练样本集的KNN文本分类方法

摘要

本发明公开了一种优化训练样本集的KNN文本分类方法,属于文本挖掘,自然语言处理等领域,解决传统KNN文本分类方法的效率和准确率低的问题。本发明在于对训练用文本数据和待分类文本数据进行文本预处理;将预处理后的训练用文本数据和待分类文本数据分别进行文本表示;对文本表示的训练用文本数据和待分类文本数据分别利用遗传算法进行特征提取;对提取的训练用文本数据特征进行分类训练,使用经过优化样本集的KNN算法进行训练分类,构造文本分类器;将文本分类器作用于特征提取后的待分类文本数据,得到待分类文本数据的分类结果。本发明能够更好的应用于文本信息挖掘系统。

著录项

  • 公开/公告号CN104063472B

    专利类型发明专利

  • 公开/公告日2017-02-15

    原文格式PDF

  • 申请/专利权人 电子科技大学;

    申请/专利号CN201410305607.0

  • 发明设计人 屈鸿;谌语;绍领;解修蕊;黄利伟;

    申请日2014-06-30

  • 分类号G06F17/30(20060101);G06N3/02(20060101);

  • 代理机构51223 成都华风专利事务所(普通合伙);

  • 代理人徐丰

  • 地址 611731 四川省成都市高新区(西区)西源大道2006号

  • 入库时间 2022-08-23 09:52:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-02-15

    授权

    授权

  • 2014-10-22

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20140630

    实质审查的生效

  • 2014-09-24

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号