Feature-Rich Language-Independent Syntax-Based Alignment for Statistical Machine Translation

机译：统计机器翻译的基于功能丰富的语言独立语法的对齐方式

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

We present an accurate word alignment algorithm that heavily exploits source and target-language syntax. Using a discriminative framework and an efficient bottom-up search algorithm, we train a model of hundreds of thousands of syntactic features. Our new model (1) helps us to very accurately model syntactic transformations between languages; (2) is language-independent; and (3) with automatic feature extraction, assists system developers in obtaining good word-alignment performance off-the-shelf when tackling new language pairs. We analyze the impact of our features, describe inference under the model, and demonstrate significant alignment and translation quality improvements over already-powerful baselines trained on very large corpora. We observe translation quality improvements corresponding to 1.0 and 1.3 BLEU for Arabic-English and Chinese-English, respectively.

机译：我们提出了一种精确的单词对齐算法，该算法大量利用了源语言和目标语言语法。使用判别框架和有效的自下而上的搜索算法，我们训练了包含数十万个句法特征的模型。我们的新模型（1）帮助我们非常准确地对语言之间的句法转换进行建模; （2）与语言无关; （3）具有自动特征提取功能，可帮助系统开发人员在解决新语言对时，获得现成的良好字对齐性能。我们分析了功能的影响，描述了模型下的推论，并展示了在大型语料库上已经训练有力的基线之上的显着对齐和翻译质量改进。我们发现阿拉伯语-英语和中文-英语的翻译质量分别提高了1.0和1.3 BLEU。

著录项

来源
《Conference on empirical methods in natural language processing;EMNLP 2011》|2012年|p.497-507|共11页
会议地点
作者
Jason Riesa; Ann Irvine; Daniel Marcu;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类程序设计、软件工程;程序设计、软件工程;
关键词

相似文献

外文文献
中文文献
专利

1. Syntax-Based Chinese-Vietnamese Tree-to-Tree Statistical Machine Translation with Bilingual Features [J] . Gao Shengxiang, Huang Jihao, Xue Mingya, ACM transactions on Asian language information processing . 2019,第4期

机译：基于句法的汉语-越南树到树统计机器翻译与双语功能
2. Syntax-Based Context Representation for Statistical Machine Translation [J] . Kehai CHEN, Tiejun ZHAO, Muyun YANG IEICE transactions on information and systems . 2018,第12期

机译：统计机器翻译的基于语法的上下文表示
3. Syntax-Based Statistical Machine Translation [J] . Christian Hadiwinoto Computational linguistics . 2017,第4期

机译：基于语法的统计机器翻译
4. Feature-Rich Language-Independent Syntax-Based Alignment for Statistical Machine Translation [C] . Jason Riesa, Ann Irvine, Daniel Marcu Conference on empirical methods in natural language processing . 2011

机译：功能丰富的语言无关语法基于统计机器翻译的对齐
5. Discriminative Feature-Rich Modeling for Syntax-Based Machine Translation. [D] . Gimpel, Kevin. 2012

机译：基于语法的机器翻译的区分特征丰富建模。
6. 3145 An Evaluation of Machine Learning and Traditional Statistical Methods for Discovery in Large-Scale Translational Data [O] . Megan C Hollister, Jeffrey D. Blume 2019

机译：3145对机器学习和传统统计方法的评估以发现大规模翻译数据
7. Discriminative feature-rich models for syntax-based machine translation. [O] . Kevin Dixon 2012

机译：基于语法的机器翻译的辨别特征丰富模型。

Feature-Rich Language-Independent Syntax-Based Alignment for Statistical Machine Translation

摘要

著录项

相似文献

相关主题

期刊订阅