基于预训练模型的文本摘要优化

黄敬轩; 刘康军; 梁楚衡; 江健武; 颜子桓; 田志锋

首页> 中文期刊> 《工业控制计算机》 >基于预训练模型的文本摘要优化

基于预训练模型的文本摘要优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Transformers的双向编码器表示(BERT)是最新的预训练语言模型的代表之一,它成功地解决了一系列自然语言处理(NLP)任务.用于文本摘要的BERT体系结构(BERTSUM)是一个文本摘要模型,在预训练模型BERT作为编码器,使用多个"[CLS]"标签、区间段标签和线性分类器、RNN分类器或Transformer作为分类器的情况下,BESTSUM在抽象和抽取摘要方面都优于其他模型.然而,当数据集太小或训练步骤太长时,BERTSUM可能会出现过拟合现象.提出了一种基于BERT的小数据集句子嵌入方法,并在损失函数中加入了余弦相似性约束来减少过拟合程度.最后在CNN/DailyMail数据集及其较小型版本上测试这些方法.实验结果表明,与BERTSUM相比,该模型提高了抽取式摘要的Recall-Oriented Understudy for Gisting Evaluation(ROUGE)F1分数,并且过拟合的程度更小.

著录项

来源
《工业控制计算机》 |2021年第7期|58-61|共4页
作者
黄敬轩; 刘康军; 梁楚衡; 江健武; 颜子桓; 田志锋;
展开▼
作者单位

南网电网深圳供电局有限公司广东深圳 518000;

南网电网深圳供电局有限公司广东深圳 518000;

南网电网深圳供电局有限公司广东深圳 518000;

南网电网深圳供电局有限公司广东深圳 518000;

南网电网深圳供电局有限公司广东深圳 518000;

南网电网深圳供电局有限公司广东深圳 518000;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
抽取式摘要; 预训练语言模型; 自然语言处理; 小数据集;

相似文献

中文文献
外文文献
专利

1. TSPT:基于预训练的三阶段复合式文本摘要模型 [J] . 吕瑞 ,王涛 ,曾碧卿 . 计算机应用研究 . 2020,第010期
2. 弹幕文本情感分类模型研究--基于中文预训练模型与双向长短期记忆网络 [J] . 陈志刚 ,岳倩 ,赵威 . 湖北工业大学学报 . 2021,第6期
3. 基于BERT双向预训练的图模型摘要抽取算法 [J] . 方萍 ,徐宁 . 计算机应用研究 . 2021,第009期
4. 基于Bert预训练模型的虚假新闻文本检测 [J] . 王国泰 ,董晶晶 ,高杨 . 信息技术 . 2022,第1期
5. 基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究 [J] . 宋建炜 ,邓逸川 ,苏成 . 图学学报 . 2021,第002期
6. 结合预训练模型和语言知识库的文本匹配方法 [C] . Yeheng Zhou ,周烨恒 ,Jiahan Shi . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于预训练模型及强化学习的自动文本摘要研究 [A] . 王亓才 . 2021

基于预训练模型的文本摘要优化

摘要

著录项

相似文献

相关主题

期刊订阅