首页> 中文学位 >采用统计机器翻译模型的复述生成技术研究
【6h】

采用统计机器翻译模型的复述生成技术研究

代理获取

目录

采用统计机器翻译模型的复述生成技术研究

ADAPTING MACHINE TRANSLATION MODELS FOR PARAPHRASE GENERATION

摘要

Abstract

第1章 绪论

1.1 课题背景与意义

1.2 国内外相关研究

1.3 本文研究内容

1.4 本文的结构

第2章 人机结合的复述生成评测方法

2.1 已有复述评测方法

2.2 人工评价与自动评价相结合的复述生成评测

2.3 本章小结

第3章 面向多任务的一体化统计复述生成

3.1 统计复述生成与机器翻译的区别

3.2 统计复述生成模型

3.3 实验设置及实验数据

3.4 实验结果及分析

3.5 本章小结

第4章 基于多翻译引擎的复述生成

4.1 基于多机器翻译引擎获取候选复述

4.2 两种高质量的复述生成方法

4.3 实验设置及实验数据

4.4 实验结果及分析

4.5 本章小结

结论

参考文献

哈尔滨工业大学硕士学位论文原创性声明

致谢

展开▼

摘要

所谓复述,就是对相同语义的不同表达方式,是自然语言中比较普遍的一个现象,它集中反映了语言的灵活性和多样性。近年来,自然语言处理各种底层技术的不断发展和成熟,为复述研究提高了可能,使之受到越来越多的关注。有许多学者针对复述问题展开了大量研究,在英文和日文方面,复述技术已经被成功的应用到信息检索、自动问答、信息抽取、自动文摘以及机器翻译等多个领域,有效地提高了这些系统的性能。
  复述研究主要分为两大类:一类是复述资源的获取,即从各式语料中基于各种方法抽取复述句对、复述短语、复述模板等不同粒度和形式的复述资源;另一类是复述生成,通常指的是句子级的复述生成,即由计算机自动生成给定句子的复述句。本文重点研究了基于统计模型的复述生成技术。
  复述生成在自然语言处理的诸多方向均有重要应用,但目前在这方面的研究还很不够。本文通过对复述生成问题本质的分析以及与其它相关研究问题(尤其是机器翻译)的比较,在统计机器翻译模型的基础上进行改进,提出了一种统计复述生成方法。该方法的主要特色体现在以下两方面:
  (1)该方法可以基于一个统一的统计模型框架,针对不同的复述任务生成复述;(
  2)该方法可以轻易地结合多种资源来提升复述生成的性能。然而,该方法仍然需要极为丰富的复述资源作为基础,但优质的复述资源往往是很难获得的。因此,本文在此基础上又提出了一种基于枢轴法和多机器翻译引擎生成复述的方法,该方法首先利用多枢轴方法为源语言句子获得候选复述集,然后分别使用基于选择和基于解码的技术,为源语言句子生成复述。
  实验结果表明,本文提出的方法可以很容易地从一种应用切换到另一种应用,并且生成很有价值的复述句子,而通过多枢轴方法则可以简单高效地获得大量优质的候选复述,从而进一步提高复述生成的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号