基于弱监督学习的实体关系抽取方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

大数据相关产业与技术的发展使得科技信息服务业面临前所未有的机遇和挑战，需要对现有的应用进行研究与改进，这些应用都广泛而深入的依赖知识图谱，如:搜索引擎、个人智能助手、机器翻译和问答系统等。
　　作为从无结构文本中构建知识图谱（或称知识库）的关键性步骤，上述应用从实体关系抽取中受益良多。而作为弱监督学习实体关系抽取的两种重要方法，Rel-LDA和Type-LDA，近年来颇受重视。但是，这两个模型继承了LDA模型的“词袋假设”，存在诸多限制。为打破这一限制，本文结合TNG模型的在多元语法特征方面的长处，提出了Rel-TNG和Type-TNG两个模型，并详细给出了两个模型的吉布斯采样算法。在此基础上，本文基于GENIA和EPI语料进行了试验。试验结果表明，虽然本文提出的模型和Rel-LDA、Type-LDA两个模型在表现方面的差异没有统计显著性，但是，当引入先验数据，Rel-TNG和Type-TNG的表现明显优于前者
　　主题模型实体关系抽取大规模应用的主要障碍是高昂的计算成本，在资源有限的情况下，这表现为模型训练速度缓慢。究其根本原因，相关的成本产生于:不同CPU上变量的同步以保持一致性;多种候选关系时的采样过程等。幸运的是，已有的一些研究可以大大降低计算成本。本文针对Rel-TNG和Type-TNG模型的大规模应用进行了具体分析，得出结论:1）Alias方法和稀疏性方法不适用于实体关系抽取主题模型;2）同步AD方法和异步AD方法作为近似方法，在模型的训练质量上与原始的采样方法存在可忽略的区别，而在训练速度上有显著提升。

著录项

作者
王政;
展开▼
作者单位

中国科学技术信息研究所;

展开▼
授予单位中国科学技术信息研究所;
学科情报学
授予学位硕士
导师姓名朱礼军,徐硕;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类信息处理（信息加工） ;
关键词
实体关系; 信息抽取; 弱监督学习; 主题模型;

相似文献

中文文献
外文文献
专利

1. 基于RGB-D图像弱监督学习的3D人体姿态估计 [J] . 申琼鑫 ,杨涛 ,徐胜 . 传感器与微系统 . 2022 ,第1期
2. 基于深度主动弱监督学习的目标检测算法研究 [J] . 孟晓璇 . 信息与电脑 . 2021 ,第002期
3. 基于非开挖泥浆性能检测系统与弱监督学习的地层岩性识别 [J] . 徐晗 ,程丹仪 ,徐永华 . 地质科技通报 . 2021 ,第006期
4. 基于弱监督学习的目标检测研究进展 [J] . 杨辉 ,权冀川 ,梁新宇 . 计算机工程与应用 . 2021 ,第016期
5. 一种基于弱监督学习的声图小目标快速检测方法 [J] . 徐利刚 ,朱可卿 ,韦琳哲 . 应用声学 . 2020 ,第003期
6. 基于弱监督学习的海量网络数据关系抽取 [C] . Chen Liwei ,陈立玮 ,Feng Yansong . 2013年中国计算机学会人工智能会议 . 2013
7. 基于弱监督学习的图像实例分割方法研究 [A] . 廖诗沙 . 2020

基于弱监督学习的实体关系抽取方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅