首页> 中文学位 >基于自举的弱指导中文语义关系抽取研究
【6h】

基于自举的弱指导中文语义关系抽取研究

代理获取

目录

文摘

英文文摘

第一章 绪 论

第二章 关系抽取相关工作

第三章 基于自举学习的弱指导中文语义关系抽取

第四章 实验结果及分析

第五章 总结与展望

参 考 文 献

攻读硕士学位期间公开发表的论文

致 谢

展开▼

摘要

命名实体间语义关系抽取是信息抽取中的重要环节。虽然有指导的学习方法在这一方面已经获得了一定的成功,但它依赖于大规模的已标注语料库,而这需要费时费力的人工标注。
   本文提出了基于自举的弱指导中文语义关系抽取方法。给定一个小规模的已标注数据集(初始种子集)和一个大规模的未标注数据集,利用种子集本身来不断地扩展标注数据集,从而在小规模的标注集上也能取得较好的结果。特别地,本文提出了基于层次聚类的分层种子选取策略,通过将关系实例聚类到不同的簇并从中选取相应种子的方法来构造初始种子集,然后在此基础上实现基于自举的弱指导中文语义关系抽取。
   在ACE RdC2005中文基准语料库上进行的关系大类分类的实验表明,采用基于层次聚类的分层选取策略,弱指导中文语义关系抽取的F值达到了63.4,相比随机选取(F值为57.9)和顺序选取(F值为52.4)方法,其F值分别提高了5.5和11,这说明本文所提出的方法能显著提高弱指导中文语义关系抽取的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号