基于预训练模型的文博数据命名实体识别方法

赵卓; 田侃; 张殊; 张晨; 吴涛; 姜丰; 游小琳

首页> 中文期刊> 《计算机应用》 >基于预训练模型的文博数据命名实体识别方法

基于预训练模型的文博数据命名实体识别方法

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

在对文博数据进行知识图谱的构建时,从文本中抽取出有效的三元组尤为重要,因而命名实体识别成为挖掘文博数据的首要任务。传统的中文实体命名识别方法多采用深度神经网络模型,此类方法在对词进行向量化处理时只是将词映射成单一的词向量,并不能很好地表示词的多义性。预训练语言模型能够有效地对字进行向量化表示,将语义信息充分地结合。因此,针对文博数据提出一种基于BERT的预训练实体识别模型,采用BERT预训练模型进行词嵌入,通过利用双向长短期记忆网络(BiLSTM)模型结合上下文信息来增强词向量的语义信息,然后利用条件随机场(CRF)模型进行解码。与传统长短期记忆(LSTM)网络和BiLSTM-CRF模型相比,该模型在微软公开数据集(MSRA)以及自行标注文博知识数据集上表现突出,在文博知识数据集中,模型的准确率达到93.57%,召回率达到75.00%,F1值达到73.58%。

著录项

来源
《计算机应用》 |2022年第s01期|48-53|共6页
作者
赵卓; 田侃; 张殊; 张晨; 吴涛; 姜丰; 游小琳;
展开▼
作者单位

重庆中国三峡博物馆文物信息部;

重庆邮电大学网络空间安全与信息学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
命名实体识别; 预训练; 知识图谱; 自然语言处理; 深度学习;

相似文献

中文文献
外文文献
专利

1. 基于ALBERT预训练模型的通用中文命名实体识别方法 [J] . 吕海峰 ,冀肖榆 ,陈伟业 . 梧州学院学报 . 2022,第3期
2. 基于预训练语言模型的中文地址命名实体识别 [J] . 李廷元 ,杨勇 . 现代计算机 . 2022,第15期
3. 基于预训练模型与神经网络的军事命名实体识别 [J] . 金浩哲 ,董宝良 ,杨诚 . 电子设计工程 . 2022,第20期
4. 基于预训练模型的军事领域命名实体识别研究 [J] . 童昭 ,王露笛 ,朱小杰 . 数据与计算发展前沿 . 2022,第5期
5. 基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究 [J] . 宋建炜 ,邓逸川 ,苏成 . 图学学报 . 2021,第002期
6. 基于大数据下MapReduce模型的汉英机构命名实体对识别探究 [C] . 王东波 ,朱丹浩 ,沈思 . 第二十七届全国计算机信息管理学术研讨会 . 2013
7. 基于跨语言预训练模型的无监督命名实体识别研究 [A] . 陈韦乐 . 2020

基于预训练模型的文博数据命名实体识别方法

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅