汉语句子骨架成分识别

摘要

本文提出了一种利用统计学习算法进行汉语句子骨架成分识别的方法。骨架成分识别基于短句进行,包括主语、核心动词短语、宾语等。骨架成分的单位是基本短语。利用IOB模型编码,将骨架成分识别作为分类问题处理。在两个方面对概率多分类器用于该任务时做了改进:一是在分类判别时,对每一种成分的N-best分类结果缓冲,将概率最高的作为结果输出;二是利用语序对分类结果进行修正。实验数据是宾州中文树库5.1(CTB5.1),共提取了55,614个短句进行训练和测试,主要骨架成分识别的F<,1>值分别为:主语88.22%,核心动词短语94.46%,直接宾语83.57%,间接宾语18.18%,补语81.85%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号