一种细粒度的汉语语义角色标注数据集的构建方法

宋衡; 曹存根; 王亚; 王石

首页> 中文期刊> 《中文信息学报》 >一种细粒度的汉语语义角色标注数据集的构建方法

一种细粒度的汉语语义角色标注数据集的构建方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

语义角色对自然语言的语义理解和分析有着重要的作用,其自动标注技术依赖良好的语义角色标注训练数据集。目前已有的大部分语义角色数据集在语义角色的标注上都不够精确甚至粗糙,不利于语义解析和知识抽取等任务。为了满足细粒度的语义分析,该文通过对实际语料的考察,提出了一种改进的汉语语义角色分类体系。在此基础上,以只有一个中枢语义角色的语料作为研究对象,提出了一种基于半自动方法的细粒度的汉语语义角色数据集构建方法,并构建了一个实用的语义角色数据集。截至目前,该工程一共完成了9550条汉语语句的语义角色标注,其中含有9423个中枢语义角色,29142个主要周边语义角色,3745个辅助周边语义角色,172条语句被进行了双重语义角色标注,以及104条语句被进行了不确定语义事件的语义角色标注。我们采用Bi-LSTM+CRF的基线模型在构建好的汉语语义角色数据集和公开的Chinese Proposition Bank数据集进行了关于主要周边语义角色的基准实验。实验表明,这两个语义角色数据集在主要周边语义角色自动识别方面存在差异,并且为提高主要周边语义角色的识别准确率提供了依据。

著录项

来源
《中文信息学报》 |2022年第12期|52-66|共16页
作者
宋衡; 曹存根; 王亚; 王石;
展开▼
作者单位

中国科学院计算技术研究所智能信息处理重点实验室;

中国科学院大学;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
语义角色; 细粒度语义标注; 汉语语义角色标注; 汉语语义分析;

相似文献

中文文献
外文文献
专利

1. 一种轻量级的汉语语义角色标注规范 [J] . 刘亚慧 ,杨浩苹 ,李正华 . 中文信息学报 . 2020,第004期
2. 一种适合弱标签数据集的图像语义标注方法 [J] . 田枫 ,沈旭昆 . 软件学报 . 2013,第10期
3. 基于模糊机制和语义密度聚类的汉语自动语义角色标注研究 [J] . 王旭阳 ,朱鹏飞 . 计算机应用与软件 . 2019,第009期
4. 基于语义组块分析的汉语语义角色标注 [J] . 丁伟伟 ,常宝宝 . 中文信息学报 . 2009,第005期
5. 一种融合依存句法分析和语义角色标注的领域新闻热点话题识别方法 [J] . 姜凌昊 ,王兴芬 . 信息与电脑 . 2021,第19期
6. 基于半监督方法的汉语语义角色标注 [C] . 张祎挺 ,王小捷 ,罗思明 . 中国人工智能学会第12届全国学术年会 . 2007
7. 基于联想记忆的汉语框架语义角色标注 [A] . 王晓晖 . 2021

一种细粒度的汉语语义角色标注数据集的构建方法

摘要

著录项

相似文献

相关主题

期刊订阅