面向特定领域的命名实体识别技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

知识库的出现使得互联网海量的知识能够被搜索、智能问答、阅读理解等系统高效地利用，而知识库的构建则需要将海量的非结构化文本数据转变为结构化数据并存储，在这个构建过程中，最基础且重要的步骤为命名实体识别，即识别出非结构化文本中所有的专有名词并对其进行实体分类。
　　基于深度学习的命名实体识别模型已经成功地运用在新闻、论坛等通用领域，而在特定领域中，由于缺少标注训练语句，深度学习模型往往表现较差。针对上述问题，本文从两个不同角度分别提出了两种方法，来解决深度学习在面向特定领域实体识别过程中的问题:
　　(1)基于归纳学习的命名实体识别学习框架。该框架能够向已有特定领域命名实体识别模型（老师）学习，并将所学知识迁移到任意深度神经网络模型（学生）中。该框架使用归纳学习和多示例学习技术，使得学生模型从老师模型学得知识同时免受数据噪声干扰。该框架能够在小领域内帮助深度学习模型有效地利用现有资源（模型、标注数据和未标注数据）。在疾病领域上的实验也证明，在没有任何标注数据的情况下，该框架能够有效地提升深度命名实体识别模型的识别准确率。
　　(2)基于对抗训练的多任务命名实体识别学习方法。该方法提出一种“共享-私有”模型，综合特定领域内多个相关但不相同的子领域任务数据集信息，在对抗训练的帮助下，共同提升各个子领域内实体识别准确率。该方法在生物医学领域内的实验也证明了其能同时提升多个子领域命名实体识别准确率。
　　本文所提出的两种方法均能在一定程度上缓解命名实体识别任务在特定领域内标注数据少且昂贵的难题。本文的研究成果应用于973计划“中国工程科技知识中心建设”项目中，相关成果发表于2017年自然语言处理重要国际会议EMNLP。

著录项

作者
张宁;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机科学与技术
授予学位硕士
导师姓名汤斯亮,吴飞;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理 ;
关键词
文本数据; 命名实体识别; 归纳学习; 对抗训练;

相似文献

中文文献
外文文献
专利

1. 特定领域的命名实体识别方法的研究 [J] . 依力达尔·依明 . 电脑知识与技术 . 2020 ,第008期
2. 特定领域的命名实体识别方法的研究 [J] . 张磊 . 计算机与现代化 . 2018 ,第003期
3. 面向中文中医药领域的命名实体识别 [J] . 雷迪 ,张璞 . 电子制作 . 2021 ,第018期
4. 军用软件测试领域的命名实体识别技术研究 [J] . 韩鑫鑫 ,贲可荣 ,张献 . 计算机科学与探索 . 2020 ,第005期
5. 日本面向未来的特定科技领域技术预见分析 [J] . 王达 . 今日科苑 . 2020 ,第005期
6. 面向特定领域的多文档文摘技术研究 [C] . . 第四届全国信息检索与内容安全学术会议 . 2008
7. 面向生物医学领域的命名实体识别技术研究 [A] . 陈鹏 . 2020

面向特定领域的命名实体识别技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅