基于半监督的汉缅双语词典构建方法

毛存礼; 陆杉; 王红斌; 余正涛; 吴霞; 王振晗

首页> 中文期刊> 《中文信息学报》 >基于半监督的汉缅双语词典构建方法

基于半监督的汉缅双语词典构建方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

汉缅双语词典是开展机器翻译、跨语言检索等研究的重要数据资源.当前在种子词典的基础上使用迭代自学习的方法在平行语料中抽取双语词典取得了较好的效果,然而针对低资源语言汉语-缅语的双语词典抽取任务,由于双语平行资源匮乏,基于迭代自学习的方法不能得到有效的双语词向量表示,致使双语词典抽取模型准确度较低.研究表明,可比语料中相似词语往往具有相似的上下文,为此,该文提出了一种基于半监督的汉缅双语词典构建方法,通过利用预训练语言模型来构建双语词汇的上下文特征向量,对基于可比语料和小规模种子词典的迭代自学习方法得到的汉缅双语词汇进行语义增强.实验结果表明,该文提出的方法相较于基线方法有明显的性能提升.

著录项

来源
《中文信息学报》 |2021年第7期|47-53|共7页
作者
毛存礼; 陆杉; 王红斌; 余正涛; 吴霞; 王振晗;
展开▼
作者单位

昆明理工大学信息工程与自动化学院云南昆明 650500;

昆明理工大学云南省人工智能重点实验室云南昆明 650500;

昆明理工大学信息工程与自动化学院云南昆明 650500;

昆明理工大学云南省人工智能重点实验室云南昆明 650500;

昆明理工大学信息工程与自动化学院云南昆明 650500;

昆明理工大学云南省人工智能重点实验室云南昆明 650500;

昆明理工大学信息工程与自动化学院云南昆明 650500;

昆明理工大学云南省人工智能重点实验室云南昆明 650500;

昆明理工大学信息工程与自动化学院云南昆明 650500;

昆明理工大学云南省人工智能重点实验室云南昆明 650500;

昆明理工大学信息工程与自动化学院云南昆明 650500;

昆明理工大学云南省人工智能重点实验室云南昆明 650500;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
汉缅双语; 种子词典; 迭代自学习; 预训练语言模型; 上下文特征; 半监督;

相似文献

中文文献
外文文献
专利

1. 双语词典释义性质和内容的再思考——外汉双语词典的认知语义结构暨译义模式的构建 [J] . 章宜华 . 广东外语外贸大学学报 . 2005,第B11期
2. 融合主题模型及双语词向量的汉缅双语可比文档获取方法 [J] . 李训宇 ,毛存礼 ,余正涛 . 中文信息学报 . 2021,第001期
3. 基于统计和词典方法相结合的韩汉双语语料库名词短语对齐 [J] . 凌天斌 ,毕玉德 . 中文信息学报 . 2018,第008期
4. 认知语义结构与意义驱动释义模式的构建——兼谈外汉双语词典的释义性质与释义结构 [J] . 章宜华 . 现代外语 . 2006,第4期
5. 基于深度学习的双语词典构建方法研究 [J] . 李祥祥 ,石刚 . 现代计算机（专业版） . 2021,第021期
6. 基于小规模俄汉双语词典的俄语形态切分 [C] . 黄云 ,姜文斌 ,王志洋 . 第七届全国机器翻译研讨会 . 2011
7. 汉藏双语情感词典构建及情感计算研究 [A] . 孙本旺 . 2019

基于半监督的汉缅双语词典构建方法

摘要

著录项

相似文献

相关主题

期刊订阅