首页> 中文学位 >基于事件框架的突发事件信息抽取
【6h】

基于事件框架的突发事件信息抽取

代理获取

摘要

在目前信息爆炸的时代,基于事件框架的新闻信息抽取技术能够更好地满足人们获知网上有效信息的需要。通过对新闻语料的分析,可以预定义三类突发事件的框架结构,由此可对事件各侧面采取定制的处理。利用对新闻报道的词性标注、对地点数据库的查询以及基于语料研究的一些抽取规则的制订,能有效地抽取新闻事件的时间、地点、结果等各侧面信息。 由于新闻事件的复杂及动态发展的特点,基于事件框架信息抽取中存在一个问题:静态结构的框架限定了能抽取的侧面内容。为此,本文引入事件新侧面探测方法,采用自动探测方法寻找框架中未预定义的侧面。为充分利用句子中词性、语序及词之间的关系,本文使用词对特征模型进行特征提取,选择基于段落的LSA聚类算法来实现新侧面探测。 根据原型系统在突发事件语料库上的测试结果,本文提出的方法被证明是切实可行的,对于突发事件新闻要素的抽取达到了较高的正确率和召回率。事件新侧面探测的结果较好地表现了单个事件的特性和同类事件未包含在框架内的某些共性。实验结果证明了本研究的应用前景。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号