基于抽象语义表示的汉语构式的标注与分析

摘要

构式作为组成成分与实际意义不能完全对应的结构,与常规句子差异较大,对句法和语义分析器的影响较大,构式的自动分析则更是困难.因此,需要研究构式的内部结构标注与语料构建.由于构式的语义结构与句法结构有较大差异,使用中文抽象语义表示(CAMR)来直接标注构式的语义结构.目前收录最全的构式库是北京大学现代汉语构式知识库,通过对该构式库共1057条构式进行人工标注并统计后,发现CAMR可以表示出61.2%的基本符合组合原则的构式;而38.8%不符合组合原则的构式需要修改或添加概念,存在缺少概念、组成成分难以拆分、修辞意义难以表示等情况.该文给出的策略是将其整体作为一个谓词标注或只标注其表层义.汉语构式库的标注可以为构式语义的自动分析提供理论与数据基础.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号