首页> 中文学位 >汉语文本事件链自动生成系统
【6h】

汉语文本事件链自动生成系统

代理获取

目录

封面

目录

中文摘要

英文摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文主要研究内容

1.4 论文框架

第二章 主题片段的划分

2.1 段落相似度的主题划分方法

2.2 基于支持向量机的主题划分方法

2.3 实验结果

2.4 本章小结

第三章 基于词汇链构建事件链

3.1 词汇链构建

3.2 事件链构建

3.3 实验结果及分析

3.4 本章小结

第四章 事件链生成系统

4.1 系统综述

4.2 主题片段划分模块

4.3 词汇链构建模块

4.4 事件链构建模块

4.5 本章小结

第五章 结论与展望

5.1 结论

5.2 展望

参考文献

攻读学位期间取得的研究成果

致谢

个人简况及联系方式

声明

展开▼

摘要

事件链的构建有助于理解文章的结构,熟悉文章的框架,为文章的深层理解奠定基础。事件链反映了文本中事件的脉络,它与词汇链紧密相关。目前构建的事件链大都是线性结构,没有区分主次要事件,对文章重点的把握不是很明确。因此本文提出了一种在主题片段划分的基础上通过词汇链来构建事件链的新方法,分清了主次,表现出文章的层次结构,对文章的基本框架刻划更为准确。
  主要分为以下三部分:
  (1)利用支持向量机(support vector machine, SVM),寻找有效特征对文章进行主题片段划分。根据主题片段的两个特点,本文通过提取主题转移的边界特征以及主题内句子的相似性特征基于SVM模型划分出文本主题片段。
  (2)采用基于《知网》的方法计算词汇的词义相似度来构建文章的词汇链。提取文章中的名词,构建候选词汇集,每一步都为候选词汇集中的词语选择与它最相关的词汇链并把该词加入到该链中。
  (3)结合划分的主题片段及词汇链构建出事件链。构建出的词汇链有多条,找出其中的最强词汇链,对最强词汇链寻找事件触发词,构建初始事件链,再结合主题片段判断事件链中的主次要事件,构建包含主次关系的事件链。
  本文基于Java语言实现事件链自动生成系统,共分为三个模块:主题片段的划分,词汇链的构建,事件链的构建。通过在Treebank新闻语料上测试该系统,得到生成的事件链的准确率为65.39%,召回率为67.59%。实验结果表明,通过词汇链构建出的事件链能有效表现篇章的主次要信息。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号