Neural semi-Markov CRF for Monolingual Word Alignment

机译：神经半马尔可夫CRF用于单声道词对齐

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Monolingual word alignment is important for studying fine-grained editing operations (i.e., deletion, addition, and substitution) in text-to-text generation tasks, such as paraphrase generation, text simplification, neutralizing biased language, etc. In this paper, we present a novel neural semi-Markov CRF alignment model, which unifies word and phrase alignments through variable-length spans. We also create a new benchmark with human annotations that cover four different text genres to evaluate monolingual word alignment models in more realistic settings. Experimental results show that our proposed model outperforms all previous approaches for monolingual word alignment as well as a competitive QA-based baseline, which was previously only applied to bilingual data. Our model demonstrates good generalizability to three out-of-domain datasets and shows great utility in two downstream applications: automatic text simplification and sentence pair classification tasks.

机译：单语对齐对于在文本到文本生成任务中研究细粒度编辑操作（即删除，加法和替换）是重要的，例如释义生成，文本简化，中和偏置语言等。在本文中，我们提出了一种新型神经半标率CRF对准模型，其通过可变长度跨度统一字和短语对齐。我们还创建了一个新的基准，具有人类注释，涵盖四种不同的文本类型，以评估更现实的设置中的单声道词对齐模型。实验结果表明，我们提出的模型优于单语对齐的所有先前方法以及以前仅应用于双语数据的基于竞争性的QA基准。我们的模型对三个域名数据集进行了良好的普遍性，并在两个下游应用中显示出很大的实用程序：自动文本简化和句子对分类任务。

著录项

来源
《International Joint Conference on Natural Language Processing;Annual Meeting of the Association for Computational Linguistics》|2021年|6815-6828|共14页
会议地点
作者
Wuwei Lan; Chao Jiang; Wei Xu;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Unsupervised Query Segmentation Using Monolingual Word Alignment Method [J] . Dayong Wu, Yu Zhang, Ting Liu Computer and information science . 2012,第1期

机译：单语言单词对齐方法的无监督查询细分
2. Unsupervised Query Segmentation Using Monolingual Word Alignment Method [J] . Dayong Wu, Yu Zhang, Ting Liu Computer and Information Science . 2011,第1期

机译：单语言单词对齐方法的无监督查询细分
3. Unsupervised Query Segmentation Using Monolingual Word Alignment Method [J] . Computer and Information Science . 2011,第1期

机译：单语言单词对齐方法的无监督查询细分
4. WOLVESAAR at SemEval-2016 Task 1: Replicating the Success of Monolingual Word Alignment and Neural Embeddings for Semantic Textual Similarity [C] . Hanna Bechara, Rohit Gupta, Liling Tan, International workshop on semantic evaluation;Conference of the North American Chapter of the Association for Computational Linguistics - Human Language Technologies . 2016

机译：WOLVESAAR在SemEval-2016上的任务1：为语义文本相似性复制单语言单词对齐和神经嵌入的成功
5. The effects of emotional connotations of English words on event-related potentials (ERPs) in Korean-English bilinguals and English-speaking monolinguals. [D] . Kim, Myung-Sun. 1993

机译：英语单词的情感内涵对韩英双语者和英语单语者的事件相关电位（ERP）的影响。
6. The Neural Correlates of Conflict Detection and Resolution During Multiword Lexical Selection: Evidence from Bilinguals and Monolinguals [O] . Manuel F. Pulido, Paola E. Dussias 2019

机译：多词词汇选择过程中冲突检测与解决的神经相关：来自双语者和单语者的证据
7. Hybrid semi-Markov CRF for Neural Sequence Labeling [O] . Zhixiu Ye, Zhen-Hua Ling 2018

机译：用于神经序列标记的杂交半标率CRF

Neural semi-Markov CRF for Monolingual Word Alignment

摘要

著录项

相似文献

相关主题

期刊订阅