首页> 中国专利> 一种基于自监督学习的宏基因组重叠群分类方法

一种基于自监督学习的宏基因组重叠群分类方法

摘要

本发明公开了一种基于自监督学习的宏基因组重叠群分类方法。该方法包括:将序列划分为固定长度的重叠短序列;将各短序列视作词,获取序列所有的词,通过对不同的词进行数字编码,将字符型的序列转化为数值型序列,其中不同词组成的集合作为词典;将所述数值型序列输入经训练的自监督学习神经网络模型,提取序列特征;对所提取的序列特征进行降维,以映射到低维可分类特征空间,并利用聚类算法进行分类,获得分类结果。利用本发明能够提高宏基因组重叠群分类的效率和准确度。

著录项

  • 公开/公告号CN113393898A

    专利类型发明专利

  • 公开/公告日2021-09-14

    原文格式PDF

  • 申请/专利权人 中国科学院深圳先进技术研究院;

    申请/专利号CN202110727538.2

  • 发明设计人 杨金;蔡云鹏;杨博凯;

    申请日2021-06-29

  • 分类号G16B20/30(20190101);G06K9/46(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11430 北京市诚辉律师事务所;

  • 代理人耿慧敏;朱伟军

  • 地址 518055 广东省深圳市南山区深圳大学城学苑大道1068号

  • 入库时间 2023-06-19 12:33:50

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号