关系抽取
关系抽取的相关文献在2006年到2023年内共计1131篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术
等领域,其中期刊论文346篇、会议论文22篇、专利文献28833篇;相关期刊140种,包括现代图书情报技术、计算机工程、计算机科学等;
相关会议20种,包括第32届中国数据库学术会议、2013年中国计算机学会人工智能会议、第18届全国信息存储技术学术会议等;关系抽取的相关文献由2929位作者贡献,包括刘知远、林鸿飞、余正涛等。
关系抽取—发文量
专利文献>
论文:28833篇
占比:98.74%
总计:29201篇
关系抽取
-研究学者
- 刘知远
- 林鸿飞
- 余正涛
- 杨志豪
- 孙茂松
- 程学旗
- 杨静
- 秦永彬
- 钱龙华
- 陈艳平
- 庄越挺
- 漆桂林
- 王健
- 线岩团
- 陈曦
- 周国栋
- 李丽双
- 王凯
- 黄瑞章
- 刘琼昕
- 吕学强
- 孙乐
- 杨卫哲
- 韩先培
- 韩旭
- 刘秀磊
- 吴飞
- 杨敏
- 林衍凯
- 沈颖
- 王佳升
- 肖刚
- 谭真
- 郭剑毅
- 高明
- 高盛祥
- 黄河燕
- 刘宇
- 刘旭红
- 刘晓燕
- 周傲英
- 宋威
- 康晓军
- 张奇
- 张益嘉
- 张鹏
- 彭涛
- 文瑞
- 李健
- 李军辉
-
-
蔡文晖;
李治江
-
-
摘要:
文档中的各个实体之间往往存在着复杂的交互关系,如何有效地汇总文档中的层级信息实现关系抽取是一个具有挑战性的研究问题。现有的文档级关系抽取方法普遍采用图模型结构或预训练模型编码文档,无法捕获丰富的多粒度信息。针对这一问题,本研究提出了一个双粒度注意力模型(Dual Attention Network,DAN),通过编码文档词级、句级特征与实体对特征之间的交互,实现文档各层级信息的融合。验证结果表明,该模型在大规模文档级数据集DocRED上获得了较为优异的效果,验证了本研究方法的有效性。
-
-
郎春雨;
侯霞
-
-
摘要:
实体关系抽取任务的一大挑战是缺乏有效的训练语料,迁移学习可在一定程度上缓解其语料不足的问题。概述了迁移学习4种基本方法的原理及适用场景,分析总结了迁移学习在实体和关系抽取两方面的研究进展,最后总结展望了迁移学习技术在实体关系抽取领域的发展趋势。
-
-
马瑛超;
张晓滨
-
-
摘要:
目前基于传统深度学习的关系抽取方法在复杂语境下抽取较为困难,且未考虑语境中非目标关系对关系抽取所带来的影响.针对这一问题,本文提出了控制输入长短期记忆网络CI-LSTM(control input long short-term memory),该网络在传统LSTM的基础上增加了由注意力机制和控制门阀单元组成的输入控制单元,控制门阀单元可依据控制向量进行关键位置上的重点学习,注意力机制对单个LSTM的输入的不同特征进行计算.本文通过实验最终选择使用句法依存关系生成控制向量并构建关系抽取模型,同时使用SemEval-2010 Task8关系数据集以及该数据集中具有复杂语境的样本对所提方法进行实验.结果表明,相比于传统的关系抽取方法,本文所提CI-LSTM在准确率上有进一步提升,并在复杂语境中具有更好的表现.
-
-
赵敏钧;
赵亚伟;
赵雅捷;
罗刚
-
-
摘要:
随着互联网技术的快速发展和移动设备的普及,我们每时每刻都被各种各样的信息包围着。如何从海量的数据中挖掘出具有价值的信息一直是国内外研究的热点。其中,关系抽取是信息抽取的一个重要子任务,目的是从文本中识别出实体之间的关系,从而挖掘出文本中的结构化信息,即事实三元组。在文本中,实体重叠和关系重叠是非常普遍的现象,但是现有的联合抽取模型不能够有效地解决这类问题,因此提出一种新的联合抽取模型,将关系抽取任务看作由2个子任务实体识别和关系识别组成,并分别使用序列标注的方法和多分类方法进行识别。在联合抽取过程中,为充分挖掘文本语义信息,在模型的输入层添加词性(POS)和句法依存关系(Deprel)特征,同时为消除随着句子长度增加带来的长距离依赖问题,在模型中引入注意力机制。最后,论文在NYT数据集和WebNLG数据集上进行关系抽取实验,结果表明论文提出的模型能够有效地解决关系重叠的问题,并取得最佳抽取效果。
-
-
周筠昌;
陈振彬;
陈珂
-
-
摘要:
关系抽取作为信息抽取领域近年来的研究热点,从宏观上可具体分为基于流水线的关系抽取、联合抽取和远程监督等,其中各个类别的关键性问题并不相通。近年来深度神经网络因其强大的语义表征能力,逐渐取代传统的机器学习成为关系抽取的基本模型,又可根据抽取方法细分为基于特征、卷积神经网络和注意机制模型等的关系抽取任务。随着数据规模的不断增大,自动高效地从文本中抽取结构化信息并构建知识库具有重大意义,关系抽取的研究和发展更具有必要性。文章对深度学习模型在各类关系抽取任务中的应用进行系统性评述,先主要介绍了常用的语料集及其规模、构建方式等;然后介绍深度神经网络在基于流水线的关系抽取和联合抽取任务中的具体应用,并描述两类任务的重难点问题。最后,文章认为迁移学习和小样本学习在基于深度神经网络的关系抽取研究中更具挑战性和普遍性。
-
-
杨立新;
石恋;
孙宇豪
-
-
摘要:
目前知识图谱已经受到了广泛的关注,基于知识图谱的应用层出不穷。而渔业领域的相关知识图谱并不多,渔业领域信息检索质量相对较低。因此,本文针对构建知识图谱,并提出了基于渔业领域知识图谱的问答系统的解决方法。本文从互联网等渠道通过网络爬虫搜集渔业相关数据,通过数据预处理、知识抽取等方式构建了渔业知识三元组,并采用neo4j数据库进行渔业知识图谱的持久化处理。基于渔业知识图谱,采用关系抽取和相似度计算混合方法进行答案检索,完成了对问答系统的设计。
-
-
刘辰昀;
储昭武;
夏娟
-
-
摘要:
结合上海市政务服务一网通办工作要求,本文从亲属关系证明材料的场景需求出发,以减少亲属关系证明材料提交和核验成本为目标,有效融合集成各职能部门公共数据,形成了基于自然人数据的亲属关系知识图谱构建技术框架、方法和路径。详细描述了基于自然人数据的本体模型构成,以及核心亲属关系和其他亲属关系的知识加工过程。结合公共数据治理和应用的实践,形成了标准化的本体模型、区域内三代亲属关系知识图谱和公共数据知识图谱构建方法。亲属关系知识图谱为公共数据向信息的表达和向知识的转化提供了理论参考和实践支撑,为提升政务服务效能提供支撑,为加速释放公共数据价值提供路径。
-
-
袁清波;
杜晓明;
马合林
-
-
摘要:
针对军事指挥控制保障领域各种技术数据资料挖掘处理和融合应用效率低下的问题,提出利用知识抽取技术获取关键知识及其相互关系,形成相应知识体系,以实现数据的高效利用。在知识抽取系统框架的研究与设计过程中,首先介绍了知识抽取的相关理论知识,如知识图谱、命名实体识别、关系抽取等技术;其次分析了军事领域知识抽取中命名实体识别和关系抽取的研究现状;最后设计了指挥控制保障领域知识抽取系统的总体框架和模块,包括本体建模、语料标注、命名实体识别和关系抽取等模块。首次对指挥控制保障领域的知识抽取进行研究,在系统设计过程中充分考虑了部队的实际情况,具有较强的实用性和针对性,可以为指挥控制保障领域知识图谱的后续构建提供理论指导和技术支撑。
-
-
张鋆灵;
群诺
-
-
摘要:
基于转换器的双向编码表征(Bidirectional Encoder Representation from Transformers,BERT)是由谷歌在2018发布的预训练模型,该模型在11项NLP任务中取得了最优的结果。基于此,笔者提出了基于BERT的关系抽取模型,将头节点和尾节点的先验知识融合到BERT模型中,并采用SemEval公开数据集进行实验。实验结果表明,此融合方法提高了原模型的召回率和F1值。
-
-
於欣澄;
刘慧
-
-
摘要:
国家标准信息化是贯彻落实标准化工作改革和发展的重要举措。本文通过对国家标准文本中食品领域的术语语料进行研究,挖掘分析术语之间的多类型语义关系和关系层级结构,并对标准中术语及其定义进行关系抽取,获取其中的术语实体及之间关系。基于词向量的方法进行实验,结合依存句法分析,计算中文词嵌入的相似度对目标关系聚类,筛选种子进行迭代以实现关系抽取。实验结果表明,本文方法在物质原料构成等关系的抽取上取得了较好的结果。
-
-
-
-
姜廷松
- 《第五届海外中国语言学者论坛》
| 2015年
-
摘要:
信息抽取研究已经从传统的限定类别、限定领域信息抽取任务发展到开放类别、开放领域信息抽取.技术手段也从基于人工标注语料库的统计方法发展为有效地挖掘和集成多源异构网络知识并与统计方法结合进行开放式信息抽取.关系抽取(relation extraction,RE)作为信息抽取的一部分,其任务是从自由文本中将给定实体对的关系抽取出来.本文在关系抽取研究历史的基础上,重点介绍弱指导实体关系抽取的任务、难点、方法、评测、技术水平和存在问题,并结合课题组的研究积累,对实体关系抽取发展方向以及在网络知识工程、问答系统中的应用进行分析讨论.
-
-
Chen Liwei;
陈立玮;
Feng Yansong;
冯岩松;
Zhao Dongyan;
赵东岩
- 《2013年中国计算机学会人工智能会议》
| 2013年
-
摘要:
在大数据时代,对于海量网络数据的信息抽取与应用已成为自然语言处理和信息检索技术发展的重要主题。其中,基于弱监督的关系抽取方法,因为具有不需要过多人工参与、适应性强的特点,受到了广泛的关注.目前针对它的研究主要集中在英语资源上,主要使用传统的词法和句法特征。然而,词法特征有严重的稀疏性问题,句法特征则对一些语言分析工具的性能有较强的依赖性.提出利用n-gram特征来缓解传统词法特征稀疏性的问题。特别地,这种特征还可以弥补传统句法特征在其他语言上不可靠的情况,对于关系抽取的跨语言应用有重要作用.在此基础上,针对弱监督学习中标注数据不完全可靠的情况,提出基于bootstrapping思想的协同训练方法来对弱监督关系抽取模型进行强化,并且对预测关系时的协同策略进行了详细分析。在大规模的中文和英文数据上进行实验的结果显示,把传统特征与n-gram特征相结合并进行协同训练,在中文和英文数据集上均可以提升弱监督关系抽取的效果,可以适应多语言的关系抽取需求。
-
-
-
-
HONG Wenxing;
洪文兴;
HU Zhiqiang;
胡志强;
WENG Yang;
翁洋;
ZHANG Heng;
张恒;
WANG Zhu;
王竹;
GUO Zhixin;
郭志新
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
以法学知识为中心的认知智能是当前司法人工智能发展的重要方向.本文提出了以自然语言处理(NLP)为核心技术的司法案件案情知识图谱自动构建技术.以预训练模型为基础,对涉及的实体识别和关系抽取这两个NLP基本任务进行了模型研究与设计.针对实体识别任务,对比研究了两种基于预训练的实体识别模型;针对关系抽取任务,提出融合平移嵌入的多任务联合的语义关系抽取模型,同时获得了结合上下文的案情知识表示学习.在“机动车交通事故责任纠纷”案由下,和基准模型相比,实体识别的F1值可提升0.36,关系抽取的F1值提升高达2.37.以此为基础,本文设计了司法案件的案情知识图谱自动构建流程,实现了对数十万份判决书案情知识图谱的自动构建,为类案精准推送等司法人工智能应用提供语义支撑.
-
-
刘毅;
吴浪韬;
梁雄;
罗征;
胡振中
- 《第六届全国BIM学术会议》
| 2020年
-
摘要:
随着中国建筑行业的高速发展,建筑领域在各个方面积累了大量的原始数据,如何从这些琐碎的数据中获取结构化的知识成了行业智能化所面临的新问题,而知识图谱是一个很好的解决方案.在构建知识图谱的过程中,本研究分别应用和评估了BiLSTM-CRF和ResCNN模型,结果表明它们具有良好的性能.针对机电设备规范中的属性约束条件,本研究提出了一种基于知识图谱的提取方法,该方法对于辅助BIM模型的审查具有重要意义.
-
-
刘毅;
吴浪韬;
梁雄;
罗征;
胡振中
- 《第六届全国BIM学术会议》
| 2020年
-
摘要:
随着中国建筑行业的高速发展,建筑领域在各个方面积累了大量的原始数据,如何从这些琐碎的数据中获取结构化的知识成了行业智能化所面临的新问题,而知识图谱是一个很好的解决方案.在构建知识图谱的过程中,本研究分别应用和评估了BiLSTM-CRF和ResCNN模型,结果表明它们具有良好的性能.针对机电设备规范中的属性约束条件,本研究提出了一种基于知识图谱的提取方法,该方法对于辅助BIM模型的审查具有重要意义.
-
-
刘毅;
吴浪韬;
梁雄;
罗征;
胡振中
- 《第六届全国BIM学术会议》
| 2020年
-
摘要:
随着中国建筑行业的高速发展,建筑领域在各个方面积累了大量的原始数据,如何从这些琐碎的数据中获取结构化的知识成了行业智能化所面临的新问题,而知识图谱是一个很好的解决方案.在构建知识图谱的过程中,本研究分别应用和评估了BiLSTM-CRF和ResCNN模型,结果表明它们具有良好的性能.针对机电设备规范中的属性约束条件,本研究提出了一种基于知识图谱的提取方法,该方法对于辅助BIM模型的审查具有重要意义.