首页> 中国专利> 一种基于预训练模型的阅读理解去偏方法

一种基于预训练模型的阅读理解去偏方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种基于预训练模型的阅读理解去偏方法，包括：以预训练模型BERT嵌入层为基础构建文本表示层，设定模型输入为文章‑问题构成的句子对，将输入句子映射为句子向量；对位置编码进行两次随机正则化操作，得到两个随机子模型并计算KL散度，评估其输出分布差异性，更新句子向量输入BERT编码器；将BERT编码器最后一个隐层输出通过全连接层与分类器，以交叉熵损失与KL散度之和计算样本的预测损失，在模型训练过程中根据样本的预测损失优化预训练参数，去除阅读理解位置偏差。本发明利用dropout技术正则化位置编码的基础上，通过在训练中拉低两次dropout产生的随机子模型分布的KL散度来约束随机性，提高模型对位置偏差鲁棒性的同时恢复答案预测准确度。

著录项

公开/公告号CN115526148A

专利类型发明专利
公开/公告日2022-12-27

原文格式PDF
申请/专利权人南京邮电大学;
展开▼

申请/专利号CN202211222708.2
发明设计人于舒娟;吴梦洁;赵阳;张虎;张昀;
展开▼

申请日2022-10-08
分类号G06F40/126;G06K9/62;
代理机构南京纵横知识产权代理有限公司;
代理人董建林
地址 210023 江苏省南京市栖霞区文苑路9号
入库时间 2023-06-19 18:06:33

法律信息

法律状态公告日

法律状态信息

法律状态
2022-12-27

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种基于预训练模型的机器阅读理解方法 [P] . 中国专利： CN112541347A . 2021-03-23
2. 一种基于预训练语言模型的多任务学习阅读理解方法 [P] . 中国专利： CN111581350A . 2020-08-25
3. METHOD, SYSTEM, AND COMPUTER READABLE RECORD MEDIUM FOR KNOWLEDGE DISTILLATION OF END-TO-END SPOKEN LANGUAGE UNDERSTANDING USING TEXT-BASED PRETRAINED MODEL [P] . 韩国专利： KR102368064B1 . 2022-02-25

机译：用于使用基于文本的预训练模型的端到端口语理解的知识提取的方法、系统和计算机可读记录介质
4. Method and arrangement for the computer-assisted determination of at least one property of a hair color seeds on the basis of a formulation of chemically reactive and / or unreactive raw materials, a method and arrangement for the computer-assisted determination of a formulation of a hair color seeds based on chemically reactive and / or unreactive raw materials, and apparatus and method for computer-aided training a predetermined model for the computer-assisted determination of at least one property of a hair color seeds on the basis of a formulation of chemically reactive and / or unreactive raw materials [P] . 德国专利： DE102007050434A1 . 2009-04-23

机译：用于基于化学反应性和/或非反应性原料的制剂的计算机辅助测定染发种子的至少一种性质的方法和装置，用于计算机辅助的测定毛发种子的制剂的方法和装置基于化学反应性和/或非反应性原料的染发种子，以及用于计算机辅助训练预定模型的设备和方法，该预定模型用于基于化学制剂确定计算机辅助确定染发种子的至少一种特性反应性和/或不反应性原料
5. METHOD AND APPARATUS FOR TRAINING MACHINE READING COMPREHENSION MODEL AND NON-TRANSITORY COMPUTER-READABLE MEDIUM [P] . 美国专利： US2021390454A1 . 2021-12-16

机译：用于训练机器阅读理解模型和非暂时性计算机可读介质的方法和装置