面向问答领域的数据增强方法

丁家杰; 肖康; 叶恒; 周夏冰; 张民

首页> 中文期刊> 《北京大学学报：自然科学版》 >面向问答领域的数据增强方法

面向问答领域的数据增强方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法。首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案;再后,使用问题生成模型对这些答案生成相应问题;最后,通过问答匹配模型对生成的问答对进行过滤,保留其中质量较高的数据作为最终的增强数据。该方法不需要额外的数据与领域知识,同时能够针对模型构造特定数据,耗费较少的训练代价就能使模型性能提升。实验结果表明,所提出的数据增强方法对R-Net,Bert-Base以及Luke均有效,与其他数据增强方法相比,在较少的增强数据规模下,问答模型获得更好的性能提升。

著录项

来源
《北京大学学报：自然科学版》 |2022年第1期|54-60|共7页
作者
丁家杰; 肖康; 叶恒; 周夏冰; 张民;
展开▼
作者单位

苏州大学计算机科学与技术学院;

苏州215000;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
数据增强; 问题生成模型; 自动问答模型; 质量控制;

相似文献

中文文献
外文文献
专利

1. 面向限定领域问答系统的自然语言理解方法综述 [J] . 王东升 ,王卫民 ,王石 . 计算机科学 . 2017,第008期
2. 面向ESI研究前沿数据的学科领域自动分类方法——以农业领域为例 [J] . 王成卓 ,孙巍 ,杨宇 . 农业展望 . 2021,第008期
3. 面向大规模社区问答数据的问题检索方法 [J] . 田作辉 ,关毅 . 智能计算机与应用 . 2013,第006期
4. 面向大规模社区问答数据的问题检索方法 [J] . 田作辉 ,关毅 . 智能计算机与应用 . 2013,第006期
5. 非均衡数据分类经典方法综述与面向医疗领域的实验分析 [J] . 江昊琛 ,魏子麒 ,刘璘 . 计算机科学 . 2022,第1期
6. 基于DOI构建面向医学领域科技评价的文献数据集的方法研究 [C] . 单连慧 ,李勇 ,安新颖 . 中国医学科学院/北京协和医学院医学信息研究所/图书馆2011年学术年会 . 2012
7. 面向小数据量垂直领域的问答方法研究 [A] . 雷孝钧 . 2020

面向问答领域的数据增强方法

摘要

著录项

相似文献

相关主题

期刊订阅