一种基于孪生网络预训练语言模型的文本匹配方法研究

卢美情; 申妍燕

首页> 中文期刊> 《集成技术》 >一种基于孪生网络预训练语言模型的文本匹配方法研究

一种基于孪生网络预训练语言模型的文本匹配方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

孪生网络预训练语言模型(Sentence Embeddings using Siamese BERT-Networks,SBERT)在文本匹配的表示层面上存在两个缺点:(1)两个文本查询经BERT Encoder得到向量表示后,直接进行简单计算;(2)该计算不能考虑到文本查询之间更细粒度表示的问题,易产生语义上的偏离,难以衡量单个词在上下文中的重要性。该文结合交互方法,提出一种结合多头注意力对齐机制的SBERT改进模型。该模型首先获取经SBERT预训练的两个文本查询的隐藏层向量;然后,计算两文本之间的相似度矩阵,并利用注意力机制分别对两个文本中的token再次编码,从而获得交互特征;最后进行池化,并整合全连接层进行预测。该方法引入了多头注意力对齐机制,完善了交互型文本匹配算法,加强了相似文本之间的关联度,提高了文本匹配效果。在ATEC 2018 NLP数据集及CCKS 2018微众银行客户问句匹配数据集上,对该方法进行验证,实验结果表明,与当前流行的5种文本相似度匹配模型ESIM、ConSERT、BERT-whitening、SimCSE以及baseline模型SBERT相比,本文模型在F1评价指标上分别达到了84.7%和90.4%,比Baseline分别提高了18.6%和8.7%,在准确率以及召回率方面也表现出了较好的效果,且具备一定的鲁棒性。

著录项

来源
《集成技术》 |2023年第2期|53-63|共11页
作者
卢美情; 申妍燕;
展开▼
作者单位

五邑大学智能制造学部;

中国科学院深圳先进技术研究院先进计算与数字工程研究所;

展开▼
原文格式 PDF
正文语种 chi
中图分类在其他方面的应用;
关键词
文本匹配; Sentence-BERT; 多头注意力对齐机制;

相似文献

中文文献
外文文献
专利

1. 结合广义自回归预训练语言模型与循环卷积神经网络的文本情感分析方法 [J] . 潘列 ,曾诚 ,张海丰 . 计算机应用 . 2022,第4期
2. 基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究 [J] . 宋建炜 ,邓逸川 ,苏成 . 图学学报 . 2021,第002期
3. 基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究 [J] . 宋建炜 ,邓逸川 ,苏成 . 图学学报 . 2021,第002期
4. 基于医学大数据的预训练语言模型及其医学文本分类研究 [J] . 黄敏婷 ,赵静 ,于涛 . 中华医学图书情报杂志 . 2020,第11期
5. 基于预训练语言模型的藏文文本分类 [J] . 安波 ,龙从军 . 中文信息学报 . 2022,第12期
6. 结合预训练模型和语言知识库的文本匹配方法 [C] . Yeheng Zhou ,周烨恒 ,Jiahan Shi . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018

一种基于孪生网络预训练语言模型的文本匹配方法研究

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅