【24h】

Paraphrase Recognition Using Machine Learning to Combine Similarity Measures

机译:使用机器学习结合相似度的复述识别

获取原文
获取外文期刊封面目录资料

摘要

This paper presents three methods that can be used to recognize paraphrases. They all employ string similarity measures applied to shallow abstractions of the input sentences, and a Maximum Entropy classifier to learn how to combine the resulting features. Two of the methods also exploit WordNet to detect synonyms and one of them also exploits a dependency parser. We experiment on two datasets, the MSR paraphrasing corpus and a dataset that we automatically created from the mtc corpus. Our system achieves state of the art or better results.
机译:本文介绍了可用于识别复述的三种方法。它们都采用应用于输入句子的浅层抽象的字符串相似性度量,并使用最大熵分类器来学习如何组合结果特征。其中两种方法还利用WordNet来检测同义词,其中一种方法还利用了依赖项解析器。我们在两个数据集上进行实验,MSR释义语料库和从mtc语料库自动创建的数据集。我们的系统达到了最先进的水平或更好的结果。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号