首页> 外国专利> SYSTEMS AND METHODS FOR USING MACHINE LEARNING AND DNA SEQUENCING TO EXTRACT LATENT INFORMATION FOR DNA, RNA AND PROTEIN SEQUENCES

SYSTEMS AND METHODS FOR USING MACHINE LEARNING AND DNA SEQUENCING TO EXTRACT LATENT INFORMATION FOR DNA, RNA AND PROTEIN SEQUENCES

机译:使用机器学习和DNA序列提取DNA,RNA和蛋白质序列的最新信息的系统和方法

摘要

A method of characterizing biological sequences includes: preparing a library of sequences; subjecting the sequences in the library to at least one screening experiment to obtain an experiment outcome of each of the sequences; creating a first dataset comprising identities of the sequences and the experiment outcomes of the sequences; and training a first neural network using the first dataset to extract first sequence features from the sequences in the first dataset. A second neural network may be additionally be trained using a second dataset based on an external database to generate a pre-trained model, which is used extract additional features from the first dataset.
机译:一种表征生物学序列的方法包括:制备序列文库;以及对文库中的序列进行至少一个筛选实验,以获得每个序列的实验结果;创建第一数据集,其包括序列的身份和序列的实验结果;使用第一数据集训练第一神经网络,以从第一数据集中的序列中提取第一序列特征。可以基于外部数据库使用第二数据集来另外训练第二神经网络,以生成预训练模型,该模型用于从第一数据集中提取其他特征。

著录项

  • 公开/公告号US2020118648A1

    专利类型

  • 公开/公告日2020-04-16

    原文格式PDF

  • 申请/专利权人 CHUN-CHIEH CHANG;

    申请/专利号US201916595873

  • 发明设计人 CHUN-CHIEH CHANG;

    申请日2019-10-08

  • 分类号G16B40/20;G16B30;G06N3/04;G06N3/08;

  • 国家 US

  • 入库时间 2022-08-21 11:24:50

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号