首页> 中国专利> 一种基于KNN算法的半结构化数据分类方法及装置

一种基于KNN算法的半结构化数据分类方法及装置

摘要

本发明公开一种基于KNN算法的半结构化数据分类方法及装置,该方法包括:步骤S1,将训练集中的所有训练半结构化数据都表示成计算机能够识别的数据向量;步骤S2,得到该类别的类中心向量;步骤S3,接收测试半结构化数据后,将所述测试半结构化数据表示为所述数据向量;步骤S4,计算所述测试半结构化数据与训练集中每个类的类中心向量的距离;步骤S5,计算对应的相似度;步骤S6,将所述测试半结构化数据归类为与其相似度最大的类中;该装置包括对应的训练转换单元、类中心向量计算单元、测试转换单元、距离计算单元、相似度计算单元和分类单元。这样,引入测试半结构化数据与训练半结构化数据所在类的相似性,使得分类结果准确,且提高了分类精度。

著录项

  • 公开/公告号CN108268458B

    专利类型发明专利

  • 公开/公告日2020-12-08

    原文格式PDF

  • 申请/专利权人 广东精点数据科技股份有限公司;

    申请/专利号CN201611253977.X

  • 申请日2016-12-30

  • 分类号G06F16/35(20190101);

  • 代理机构11473 北京隆源天恒知识产权代理事务所(普通合伙);

  • 代理人闫冬

  • 地址 510630 广东省广州市天河北路906高科大厦A-701

  • 入库时间 2022-08-23 11:24:31

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号