首页> 外文会议>Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies >Parallel Text Alignment and Monolingual Parallel Corpus Creation from Philosophical Texts for Text Simplification
【24h】

Parallel Text Alignment and Monolingual Parallel Corpus Creation from Philosophical Texts for Text Simplification

机译:与文本简化的哲学文本创建并行文本对齐和单声道并行语料库

获取原文

摘要

Text simplification is a growing field with many potential useful applications. Training text simplification algorithms generally requires a lot of annotated data, however there are not many corpora suitable for this task. We propose a new unsupervised method for aligning text based on Doc2Vec embeddings and a new alignment algorithm, capable of aligning texts at different levels. Initial evaluation shows promising results for the new approach. We used the newly developed approach to create a new monolingual parallel corpus composed of the works of English early modern philosophers and their corresponding simplified versions.
机译:文本简化是一种越来越多的领域,具有许多潜在的应用程序。 培训文本简化算法通常需要大量的注释数据,但是没有许多适合此任务的Corpora。 我们提出了一种新的无修改方法,用于基于Doc2VEC嵌入和新的对齐算法对齐文本,能够在不同级别对齐文本。 初始评估显示了新方法的有希望的结果。 我们利用新开发的方法来创建一个由英语早期现代哲学家的作品和相应简化版本组成的新的单声道并行语料库。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号