基于知识蒸馏的短文本分类方法

孙红; 黄瓯严

首页> 中文期刊>软件导刊 >基于知识蒸馏的短文本分类方法

基于知识蒸馏的短文本分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来,随着深度学习技术在自然语言处理任务中的广泛应用,语言模型规模越来越大。然而,大规模模型推理速度慢、资源消耗成本高,难以在工业上进行应用,小规模模型又难以达到大规模模型效果。因此提出一种基于教师—学生框架的知识蒸馏模型,以预训练模型BERT作为教师模型,以长短时记忆网络(BiLSTM)等小模型作为学生模型,通过教师指导学生学习的方式将教师模型学习到的知识迁移至学生模型中。实验结果表明,蒸馏模型将运算推理时间缩短至教师模型的1/725,将学生模型短文本分类准确率提升3.16%。

著录项

来源
《软件导刊》|2021年第6期|P.23-27|共5页
作者
孙红; 黄瓯严;
展开▼
作者单位

上海理工大学光电信息与计算机工程学院上海200093;

上海理工大学光电信息与计算机工程学院上海200093;

展开▼
原文格式 PDF
正文语种 chi
中图分类理论、方法;
关键词
知识蒸馏; 文本分类; 双向模型; 自然语言处理;

相似文献

中文文献
外文文献
专利

1. 基于知识蒸馏的短文本分类方法 [J] . 孙红 ,黄瓯严 . 软件导刊 . 2021,第006期
2. 基于知识图谱扩展的短文本分类方法 [J] . 丁连红 ,孙斌 ,张宏伟 . 情报工程 . 2018,第005期
3. 基于知识图谱扩展的短文本分类方法 [J] . 丁连红 ,孙斌 ,张宏伟 . 情报工程 . 2018,第005期
4. 基于知识自蒸馏的轻量化复杂遥感图像精细分类方法 [J] . 孙显 ,杨竹君 ,李俊希 . 指挥与控制学报 . 2021,第004期
5. 针对低频词进行改进的中文短文本分类方法 [J] . 罗孝波 ,林佳瑜 ,梁祖红 . 计算机应用研究 . 2022,第2期
6. 一种基于特征簇的微博短文本情感分类方法 [C] . ZHOU Yong-mei ,周咏梅 ,WANG Wei . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 面向社交媒体的深度短文本分类方法研究 [A] . 张斌艳 . 2021

基于知识蒸馏的短文本分类方法

摘要

著录项

相似文献

相关主题

期刊订阅