ECNU: Using Traditional Similarity Measurements and Word Embedding for Semantic Textual Similarity Estimation

机译：ECNU：使用传统的相似性度量和词嵌入进行语义文本相似性估计

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper reports our submissions to semantic textual similarity task, i.e., task 2 in Semantic Evaluation 2015. We built our systems using various traditional features, such as string-based, corpus-based and syntactic similarity metrics, as well as novel similarity measures based on distributed word representations, which were trained using deep learning paradigms. Since the training and test datasets consist of instances collected from various domains, three different strategies of the usage of training datasets were explored: (1) use all available training datasets and build a unified supervised model for all test datasets; (2) select the most similar training dataset and separately construct a individual model for each test set; (3) adopt multi-task learning framework to make full use of available training set-s. Results on the test datasets show that using all datasets as training set achieves the best averaged performance and our best system ranks 15 out of 73.

机译：本文报告了我们提交给语义文本相似性任务的提交，即“语义评估2015”中的任务2。我们使用各种传统功能（例如基于字符串，基于语料库和句法相似性度量，以及基于新颖相似性度量）构建了我们的系统分布式词表示法，这些词法是使用深度学习范式进行训练的。由于训练和测试数据集由从各个领域收集的实例组成，因此探索了使用训练数据集的三种不同策略：（1）使用所有可用的训练数据集，并为所有测试数据集建立统一的监督模型; （2）选择最相似的训练数据集，并为每个测试集分别构建一个单独的模型; （3）采用多任务学习框架，以充分利用可用的培训集。测试数据集上的结果表明，将所有数据集用作训练集都可以实现最佳的平均性能，而我们的最佳系统在73个系统中排名15。

著录项

来源
《International workshop on semantic evaluation;Conference of the North American Chapter of the Association for Computational Linguistics - Human Language Technologies》|2015年|117-122|共6页
会议地点
作者
Jiang Zhao; Man Lan; Jun Feng Tian;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Word Embedding based Textual Semantic Similarity Measure in Bengali [J] . MD. Asif Iqbal, Omar Sharif, Mohammed Moshiul Hoque, Procedia Computer Science . 2021,第a期

机译：孟加拉语嵌入基于文本语义相似度量的词
2. Sentence modeling via multiple word embeddings and multi-level comparison for semantic textual similarity [J] . Nguyen Huy Tien, Nguyen Minh Le, Tomohiro Yamasaki, Information Processing & Management . 2019,第6期

机译：通过多个词嵌入和多级比较进行句子建模，以实现语义文本相似性
3. Combining and Learning Word Embedding With WordNet for Semantic Relatedness and Similarity Measurement [J] . Yang-Yin Lee, Hao Ke, Ting-Yu Yen, Journal of the Association for Information Science and Technology . 2020,第6期

机译：结合和学习用WordNet嵌入用于语义相关性和相似性测量的单词
4. ECNU: Using Traditional Similarity Measurements and Word Embedding for Semantic Textual Similarity Estimation [C] . Jiang Zhao, Man Lan, Jun Feng Tian International workshop on semantic evaluation . 2015

机译：ECNU：使用传统的相似度测量和单词嵌入语义文本相似性估算
5. Improved GloVe Word Embedding Using Linear Weighting Scheme for Word Similarity Tasks [D] . Lu, Qinglan. 2021

机译：使用线性加权方案进行改进的手套单词嵌入单词相似性任务
6. Word and Sentence Embedding Tools to Measure Semantic Similarity of Gene Ontology Terms by Their Definitions [O] . Dat Duong, Wasi Uddin Ahmad, Eleazar Eskin, -1

机译：单词和句子嵌入工具通过其定义来测量基因本体术语的语义相似性
7. LIPN-IIMAS at SemEval-2017 Task 1: Subword Embeddings, Attention Recurrent Neural Networks and Cross Word Alignment for Semantic Textual Similarity [O] . Ignacio Arroyo-Fernández, Ivan Vladimir Meza Ruiz 2017

机译：Lipn-IIMAS在Semeval-2017任务1：子字嵌入，注意反复性神经网络和语义文本相似性的交叉字对齐

ECNU: Using Traditional Similarity Measurements and Word Embedding for Semantic Textual Similarity Estimation

摘要

著录项

相似文献

相关主题

期刊订阅