首页> 中国专利> 一种基于K最近邻KNN的文本分类方法及其设备

一种基于K最近邻KNN的文本分类方法及其设备

摘要

本发明公开了一种基于K最近邻KNN的文本分类方法及其设备。用于减小文本分类的运算量,更有效的表示文本特征信息,提高文本分类的准确率。该方法包括:将文本分解为单词,从所述单词中提取表示文本的特征信息的单词;利用所述提取的单词,将所述文本编码为字符串向量;利用所述KNN模型计算所述字符串向量与KNN模型中的样本字符串向量之间的相似度,根据所述相似度以及所述样本字符串向量对应的分类标签,确定所述字符串向量的分类标签并输出。

著录项

  • 公开/公告号CN109993216B

    专利类型发明专利

  • 公开/公告日2021-05-11

    原文格式PDF

  • 申请/专利权人 深兰科技(上海)有限公司;

    申请/专利号CN201910178920.5

  • 发明设计人 陈海波;

    申请日2019-03-11

  • 分类号G06K9/62(20060101);G06F16/35(20190101);

  • 代理机构11291 北京同达信恒知识产权代理有限公司;

  • 代理人黄志华

  • 地址 200336 上海市长宁区威宁路369号1001单元(实际楼层9楼)

  • 入库时间 2022-08-23 11:46:36

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号