首页> 中国专利> 一种多老师监督的无数据知识蒸馏方法

一种多老师监督的无数据知识蒸馏方法

摘要

本发明公开了一种多老师监督的无数据知识蒸馏方法,在不同的数据源上训练出多个大模型作为老师模型,基于迁移学习和知识蒸馏的理论在无数据的情况使用噪声生成图像,不断迭代优化图像生成质量,通过多个老师模型监督学生模型的训练,多个老师模型在输出层维度上参与监督学生模型训练。本发明在图像分类和文本分类数据集上获得较高的准确率,继而体现出本发明的有效性;在神经网络模型广泛应用的今天,神经网络的推理时间和大小是限制神经网络应用场景的主要因素,基于此,本发明能够在数据受限的情况下有效降低模型大小,同时融合多个数据源的模型知识,提高泛化能力,使神经网络能够应用到数据受限和计算受限的场景中。

著录项

  • 公开/公告号CN115564984A

    专利类型发明专利

  • 公开/公告日2023-01-03

    原文格式PDF

  • 申请/专利权人 天翼电子商务有限公司;

    申请/专利号CN202211029941.9

  • 发明设计人 孙芃;刘波;徐小龙;周松;方徐伟;

    申请日2022-08-25

  • 分类号G06V10/764;G06V10/82;G06N3/04;G06N3/08;

  • 代理机构

  • 代理人

  • 地址 100037 北京市西城区阜成门外大街31号4层429D

  • 入库时间 2023-06-19 18:09:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-03

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号