基于BERT模型与知识蒸馏的意图分类方法

廖胜兰; 吉建民; 俞畅; 陈小平

首页> 中文期刊>计算机工程 >基于BERT模型与知识蒸馏的意图分类方法

基于BERT模型与知识蒸馏的意图分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

意图分类是一种特殊的短文本分类方法,其从传统的模板匹配方法发展到深度学习方法,基于B E RT模型的提出,使得大规模的预训练语言模型成为自然语言处理领域的主流方法.然而预训练模型十分庞大,且需要大量的数据和设备资源才能完成训练过程.提出一种知识蒸馏意图分类方法,以预训练后的B E RT作为教师模型,文本卷积神经网络Text-CNN等小规模模型作为学生模型,通过生成对抗网络得到的大量无标签数据将教师模型中的知识迁移到学生模型中.实验数据包括基于真实场景下的电力业务意图分类数据集,以及通过生成对抗网络模型生成的大量无标签文本作为扩充数据.在真实数据和生成数据上的实验结果表明,用教师模型来指导学生模型训练,该方法可以在原有数据资源和计算资源的条件下将学生模型的意图分类准确率最高提升3.8个百分点.

著录项

来源
《计算机工程》|2021年第5期|73-79|共7页
作者
廖胜兰; 吉建民; 俞畅; 陈小平;
展开▼
作者单位

中国科学技术大学计算机科学与技术学院合肥 230026;

中国科学技术大学计算机科学与技术学院合肥 230026;

中国科学技术大学软件学院合肥 230031;

中国科学技术大学计算机科学与技术学院合肥 230026;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
意图分类; 预训练模型; 知识蒸馏; 生成对抗网络; 对话系统;
入库时间 2022-08-20 03:40:09

相似文献

中文文献
外文文献
专利

1. 一种结合BERT与双层LSTM的复杂长句意图分类方法 [J] . 杨振宇 ,张登辉 . 计算机应用与软件 . 2021,第012期
2. 基于BERT-TextCNN模型的临床试验筛选短文本分类方法 [J] . 杨飞洪 ,王序文 ,李姣 . 中华医学图书情报杂志 . 2021,第001期
3. 基于知识图谱、TF-IDF和BERT模型的冬奥知识问答系统 [J] . 罗玲 ,李硕凯 ,何清 . 智能系统学报 . 2021,第004期
4. 基于知识蒸馏的短文本分类方法 [J] . 孙红 ,黄瓯严 . 软件导刊 . 2021,第006期
5. 基于剪枝网络的知识蒸馏对遥感卫星图像分类方法 [J] . 杨宏炳 ,迟勇欣 ,王金光 . 计算机应用研究 . 2021,第008期
6. 基于BERT的任务导向对话系统自然语言理解的改进模型与调优方法 [C] . Qian Zhou ,周奇安 ,Zhoujun Li . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于BERT模型的敏感邮件分类方法研究 [A] . 杜鹏强 . 2021

基于BERT模型与知识蒸馏的意图分类方法

摘要

著录项

相似文献

相关主题

期刊订阅