依存句法分析
依存句法分析的相关文献在2007年到2022年内共计155篇,主要集中在自动化技术、计算机技术、科学、科学研究、汉语
等领域,其中期刊论文122篇、会议论文3篇、专利文献177371篇;相关期刊73种,包括情报理论与实践、情报学报、现代图书情报技术等;
相关会议3种,包括2013年全国理论计算机科学学术年会、第十一届全国计算语言学学术会议、第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2018)等;依存句法分析的相关文献由398位作者贡献,包括余正涛、刘挺、张丹等。
依存句法分析—发文量
专利文献>
论文:177371篇
占比:99.93%
总计:177496篇
依存句法分析
-研究学者
- 余正涛
- 刘挺
- 张丹
- 相艳
- 车万翔
- 张桂平
- 张玉洁
- 徐金安
- 线岩团
- 高凡雅
- 刘明童
- 刘楚雄
- 周俏丽
- 孙明俊
- 席耀一
- 曹峰
- 李弼程
- 李正华
- 王剑
- 石霖
- 董晓飞
- 陈钰枫
- CHEN Yufeng
- LIU Mingtong
- XU Jinan
- ZHANG Yujie
- 万常选
- 严江
- 关毅
- 刘宇鹏
- 刘梅彦
- 化柏林
- 吴汉瑜
- 吴胜兰
- 周红
- 唐晓波
- 夏大伟
- 姬东鸿
- 季铎
- 张云秋
- 张建华
- 张弘弢
- 张晓晨
- 张梅山
- 张苗苗
- 张虎
- 张鑫
- 文永华
- 曹付元
- 李博诚
-
-
黄淑兵;
张亚洲;
缪新顿;
陆杨;
杨卓敏
-
-
摘要:
随着城市交通管理警务效能的提高,公安交管接处警业务会产生大量的非结构化的文本信息,针对交通事故的分析研判、安全隐患排查等工作,通过人工查询数据库等常规分析方法,难以从大量数据中挖掘出有效的关联关系。对此,本文提出一种基于自然语言处理的交通事故隐患关联分析方法,首先利用自然语言处理技术对非结构化的文本数据进行依存句法分析,抽取事故文本数据中的实体与关系并组建事故事件三元组,然后构建事故因子匹配机制,将三元组的匹配结果转为结构化可编码的数据,结合GPU-Apriori算法挖掘编码后数据的关联关系,最后根据维护的关联结果评价映射关系得出分析结果。
-
-
於欣澄;
刘慧
-
-
摘要:
国家标准信息化是贯彻落实标准化工作改革和发展的重要举措。本文通过对国家标准文本中食品领域的术语语料进行研究,挖掘分析术语之间的多类型语义关系和关系层级结构,并对标准中术语及其定义进行关系抽取,获取其中的术语实体及之间关系。基于词向量的方法进行实验,结合依存句法分析,计算中文词嵌入的相似度对目标关系聚类,筛选种子进行迭代以实现关系抽取。实验结果表明,本文方法在物质原料构成等关系的抽取上取得了较好的结果。
-
-
师佳璐;
罗昕宇;
杨麟儿;
肖丹;
胡正升;
王一君;
袁佳欣;
余婧思;
杨尔弘
-
-
摘要:
汉语学习者依存句法树库为非母语者语料提供依存句法分析,对第二语言教学与研究,以及面向第二语言的句法分析、语法改错等相关研究有重要意义。然而,现有的汉语学习者依存句法树库数量较少,且在标注方面仍存在一些问题。为此,该文提出一个依存句法标注规范,搭建在线标注平台,并开展汉语学习者依存句法标注。该文重点介绍了数据选取、标注流程等问题,并对标注结果进行质量分析,以探索二语偏误对标注质量与句法分析的影响。
-
-
孙家媛;
张艳荣;
谢云熙;
王加迎;
张丽霞
-
-
摘要:
介绍了观点信息的概念,分析了信息单元之间的常见词性,在此基础上,根据依存句法分析和语义依存分析的结果制定相应规则进行观点信息的识别.由于评论中存在很多冗余的文本会影响评价单元的识别,本文基于观点的表达习惯提出了一种陈述性语句过滤的方法,通过对原文本进行假设性语句和陈述性语句的过滤来提高评价单元的识别率,根据实验结果可以看到电商文本评价单元的识别结果得到了提高,证明了该方法的实用性.
-
-
杨牧;
蔡言胜
-
-
摘要:
依存语法的基本思想是探讨词与词之间的依存关系。依存句法分析以依存语法为理论来源,以算法为实现手段,在语言研究和实际应用中均具有一定的价值。采用CiteSpace软件,对Web of Science核心数据库1985—2020年所收录的相关文献进行可视化分析,研究显示,依存句法分析研究的发文量呈递增趋势,研究内容聚焦于语义理解和算法设计,研究主体为计算机学界和语言学界。
-
-
汪兰兰;
姚春龙;
李旭;
于晓强
-
-
摘要:
隐式方面提取对于提升细粒度情感分析的准确性具有重要意义,然而现有隐式方面提取技术在处理大规模数据时泛化能力不强。为此,提出结合依存句法分析与交互注意力机制的隐式方面提取模型。首先利用预训练语言模型BERT生成文本的初始表征,然后传递给依存句法引导的自注意力层再次处理,再将两次处理的结果经交互注意力机制进一步提取特征,最终用分类器判断句子所属的隐式方面类别。与基线BERT及其他深度神经网络模型对比,所提模型在增强的SemEval隐式方面数据集上取得了更高的F_(1)与AUC值,证明了模型的有效性。
-
-
线岩团;
高凡雅;
相艳;
余正涛;
王剑
-
-
摘要:
依存句法分析旨在识别句子中词与词之间的句法依赖关系。依存句法能为信息抽取、自动问答和机器翻译等任务提供句法特征,提高模型性能。训练数据规模对依存句法分析模型的性能具有重要影响,训练数据的缺乏会带来严重的未知词问题和模型过拟合问题。文中针对低资源依存句法分析问题,提出了多种数据增强策略。所提方法通过同义词替换有效扩充了训练数据,缓解了未知词问题。通过多种Mixup的数据增强策略,有效缓解了模型过拟合问题,提高了模型的泛化能力。在(Universal Dependencies treebanks,UD treebanks)数据集上的实验结果表明,所提方法有效提升了小规模训练语料条件下泰语、越南语和英语依存句法分析的性能。
-
-
吕东东;
陈俊华;
毛典辉;
张青川;
赵敏;
郝治昊
-
-
摘要:
农产品标准不仅是衡量农产品安全的尺度,也是农产品安全监管的重要依据,当前农产品标准信息并没有得到系统性的关联划分与复用。针对此问题,该研究依据标准化文件的起草规范设计了农产品标准信息本体规则,在现有的农产品标准文件及相关词条数据基础上,为半结构化数据设计了正则包装器;为非结构化文本提出了一个基于依存句法分析的农产品领域开放关系抽取模型(Open Relation Extraction Model In Agricultural Products Field, OREM-AF),实现了该领域知识的自动抽取。结果表明该研究设计的包装器在提取半结构化数据信息时,准确率与F1值均在95%以上;提出的OREM-AF模型在农产品语料上准确率达74.22%、F1值为75.12%,在通用语料上准确率达84.51%、F1值为75.43%,抽取结果均好于基于依存句法分析的其他模型。依托抽取数据构建了农产品标准领域知识图谱,并在知识图谱的相互关联网络上进行了标准社区挖掘,挖掘出的关联标准知识能够为农产品标准监管提供辅助分析支撑。
-
-
王红;
吴浩正
-
-
摘要:
针对目前中文事件检测中词语之间句法依存关系利用不充分和缺乏文章全局语义信息的问题,提出了一种基于句法和全文信息增强的中文事件检测模型。模型首先引入图卷积网络(Graph convolutional network,GCN),通过捕获词语之间的依存句法关系来增强词语的特征表示。之后采用双向门控循环单元(Bidirectional gate recurrent unit,Bi-GRU)分别学习句子内和句子之间的上下文信息,得到包含文章全局信息的句向量。最后将字、词、句3个粒度的信息通过门结构进行动态融合,使用条件随机场(Conditional random field,CRF)完成对句子中触发词的识别和标注。在ACE2005和CEC中文数据集上的实验结果表明,本文方法有效提升了中文事件检测的效果。
-
-
申震;
王逊;
黄树成;
周尓昊
-
-
摘要:
针对现有的句子相似度计算中仅考虑单个词语的语义信息,而忽略了句子的语法结构信息的问题,提出了一种结合依存句法分析和词语语义相似度的计算方法.使用哈工大社会计算与信息检索研究中心研发的语言技术平台对句子进行句法分析获得依存句法分析树,从中构造包含句子成分、依存关系、词语等多特征信息的依存关系三元组.采用动态加权的方法充分利用词语在知网与同义词词林中的语义信息,通过依存关系三元组体现句子语法结构和词语语义两个层面上的语义信息,提高了相似度计算的合理性,并且扩大了可计算相似度的词语范围.实验表明:该相似度计算方法的准确性相比同类方法有了一定的提高,能更为准确的衡量句子间的相似度.
-
-
LIU Mingtong;
刘明童;
ZHANG Yujie;
张玉洁;
XU Jinan;
徐金安;
CHEN Yufeng;
陈钰枫
- 《第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2018)》
| 2018年
-
摘要:
在基于神经网络的依存句法分析中,对分析栈和决策层信息的表示和利用依然有值得深入研究的空间.针对分析栈的表示,已有工作并没有对单棵依存子树独立编码表示,导致无法利用各个依存子树的局部特征;也没有对生成的依存弧序列进行编码,导致无法利用依存弧的全局信息.针对决策层的表示,已有工作利用MLP预测转移动作,该结构无法利用历史决策动作的信息.对此,本文提出基于多特征融合编码的神经网络依存句法分析模型,基于依存子树和历史生成的依存弧表示分析栈,利用TreeLSTM网络编码依存子树信息,利用LSTM网络编码历史生成的依存弧序列,以更好的表示分析栈的局部信息和全局信息.进一步,本文提出基于LSTM网络的结构预测转移动作序列,引入历史决策动作信息作为特征辅助当前决策.以汉语为具体研究对象,在CTB5汉语依存分析数据上验证本文提出的多特征融合编码的神经网络模型,实验结果显示,汉语依存句法分析性能得到改进,在目前公布的基于转移的分析系统中取得最好成绩,在UAS和LAS评价指标上分别达到87.8%和86.8%的精度,表明本文提出的对依存子树局部特征、以及历史依存弧信息和历史决策动作信息的编码方法在改进依存分析模型性能方面的有效性.
-
-
SU Xiang-dong;
苏向东;
GAO Guang-lai;
高光来;
YAN Xue-liang;
闫学亮
- 《2013年全国理论计算机科学学术年会》
| 2013年
-
摘要:
近年来,依存句法分析逐渐成为自然语言处理领域中的研究热点.然而,蒙古文的依存句法分析尚未得到足够的重视.基于最大生成树模型在蒙古文依存关系树库TMDT上进行了蒙古文依存句法分析的研究.在简要介绍蒙古文的特点和蒙古文依存关系树库TMDT之后,详细讨论了最大生成树模型.为找到该模型在蒙古文依存句法分析中合适的特征,重点通过实验对8种特征及其组合在句法分析中的性能进行了比较.结果显示,Basic Unigram Features、Basic Bi-gram Features以及C-C sibling Features这3种特征的组合性能最佳.本研究为蒙古文依存句法分析奠定了基础.
-
-
Xu Xing;
徐幸;
Wang Houfeng;
王厚峰
- 《第十一届全国计算语言学学术会议》
| 2011年
-
摘要:
文本蕴含问题是指给定文本与假设对,判断文本和假设之间的关系,是证实、证伪还是未知.本文介绍了一个利用词汇知识库(如北京大学的中文概念词典CCD)、概率计算模型等判断文本与假设之间蕴含关系的推理模型.主要思想是:将句子间推理问题划归到词汇蕴含概率计算,然后利用知识库、网络信息和依存句法分析等工具计算每个词语的词汇蕴含概率,最后通过概率汇总形成整个句子的蕴含概率.实验结果表明,利用词汇蕴含关系实现文本推理是有效的。