机器翻译
机器翻译的相关文献在1980年到2023年内共计3123篇,主要集中在自动化技术、计算机技术、语言学、常用外国语
等领域,其中期刊论文1807篇、会议论文348篇、专利文献286085篇;相关期刊769种,包括现代图书情报技术、海外英语(下)、海外英语(中)等;
相关会议126种,包括第四届全国少数民族青年自然语言信息处理学术研讨会、第七届全国机器翻译研讨会、第十一届全国计算语言学学术会议等;机器翻译的相关文献由3775位作者贡献,包括刘群、赵铁军、苏依拉等。
机器翻译—发文量
专利文献>
论文:286085篇
占比:99.25%
总计:288240篇
机器翻译
-研究学者
- 刘群
- 赵铁军
- 苏依拉
- 余正涛
- 宗成庆
- 熊德意
- 仁庆道尔吉
- 陈家骏
- 刘洋
- 吴华
- 朱靖波
- 杨沐昀
- 黄河燕
- 程国艮
- 王海峰
- 周玉
- 戴新宇
- 肖桐
- 何中军
- 李生
- 高盛祥
- 曹海龙
- 杜权
- 吕雅娟
- 陈肇雄
- 骆卫华
- 冯志伟
- 孙茂松
- 徐冰
- 黄书剑
- 朱聪慧
- 姚天顺
- 张孝飞
- 杨宪泽
- 王振晗
- 张春良
- 文永华
- 张家俊
- 徐金安
- 王启祥
- 郭军军
- 张建兵
- 郑德权
- 于浩
- 何彦青
- 吐尔根·依布拉音
- 孟遥
- 艾山·吾买尔
- 冯冲
- 周明
-
-
程海东
-
-
摘要:
翻译技术是人工智能时代开展语言服务的重要依托,也是新时代翻译教学的重要组成部分.文章通过问卷调查发现俄语专业学生对包括机器翻译在内的翻译技术的认知存在一定偏差,特别是译后编译意识和能力缺乏,翻译技术能力亟待提升,并提出未来俄语专业教学要依据《普通高等学校本科俄语专业教学指南》的新要求,赋予俄语专业新动能、新生命,探索建构"语言+技术"和谐的俄语翻译技术教学体系.
-
-
郑爱香;
何泉;
王春霞
-
-
摘要:
随着人工智能的发展和大数据时代的来临,国际学术交流日益深化和频繁,英语学术论文成为学术界的主要交流手段之一。同时,机器翻译迅猛发展,多个互联网公司都推出了自己的机器翻译系统产品,中国的英语学术论文的译后编辑成为一股新生力量,培养并提高译后编辑能力已经是时代所需。通过分析译后编辑的准备阶段及分析机器翻译的常见问题,重点探索译后编辑能力的培养和提高。
-
-
郭子凯;
陈晨;
刘曼玲
-
-
摘要:
为探讨医学翻译中译者在“机器翻译+译后编辑”模式下如何发挥主体性,本文选取兼具语言难度和背景知识的医学学术文本,采取机器译文和人工译文进行比较的研究方法,发现了机器翻译的若干优势和译后编辑的必要性,并提出了“机器翻译+译后编辑”模式下的具体策略:译者应主动借助机器翻译;回归翻译技巧等核心技能,以改正机器译文中的错误;还可借助计算机辅助翻译或语料库资源完善术语或其他词句的表达。
-
-
张超轶;
陈媛;
张聚伟
-
-
摘要:
针对电气工程领域英汉机器翻译中平行语料稀缺的问题,在使用通用语料训练翻译模型的基础上,提出了一种融合领域术语信息的嵌入层参数初始化方法。首先,对文本进行分词预处理,将术语词划分为一个最小单元;然后,利用Glove和Word2vec在不同单语语料上训练得到两种词向量,并分别初始化嵌入层参数中常用词和术语词的向量表示;最后,利用术语词典对未登录词进行查找替换,缓解了翻译过程中由于术语而产生的严重未登录词问题。将基于注意力机制的神经机器翻译模型作为基线系统进行实验,结果表明:本文模型在电气领域测试语料上的翻译性能提高了2.713个BLEU值点。
-
-
孟卓鹏;
吴继冰;
刘丽华;
王懋;
邓苏;
黄宏斌
-
-
摘要:
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题。从这些问题出发,提出了一种跨语言舰船实体匹配算法。首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率。还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体。利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字符串比对中的有效性。
-
-
蔡晨阳
-
-
摘要:
翻译质量是译文的重要评判标准,因此控制翻译质量对于译者来说是必不可少的一环。随着时代发展,机器翻译越来越受人们关注,它不仅能为专业译者提供一些参考,同时也可以为不具备双语转换能力的普通人提供翻译途径。本文基于对两款知名翻译软件的翻译测试,试比较它们产出的译文之间有何不同,以及其与人工翻译之间的差距。同时,本文也尝试通过译前编辑来提升译文质量,以期达到机器翻译质量控制的目标。
-
-
陈柯;
柴启栋
-
-
摘要:
文章从问题意识视角出发,以石油术语为基础,引入词向量空间模型的方法展开三个相关实验对机器译文和人工译文进行对比研究,探索机器翻译结果在空间模型中的演绎和呈现。实验结果显示机器翻译对于石油术语的语言翻译准度能达到0.403。文章尝试结合计算机技术、语言学和翻译学等不同领域量化论证两种翻译结果在语义层面的接近和靠拢程度,以期探索评价分析机器翻译系统输出结果质量的新途径。
-
-
籍佳伟
-
-
摘要:
围绕"差一点没VP"句式进行研究,从"差一点"词汇语义辖域跨语言比较的基础性问题出发,在大规模语料中抽取"差一点"相关语料进行归纳,重点探讨了汉英语中该词汇近义场各成员间词义的细微差异,以期为歧义消解、语言教学及机器翻译等领域提供参考。通过替换方式考察认为,以"差一点"为核心,依照词义关联度的逐级递减顺序,存在"差一点≈险些(不希望发生的情况)≈几乎≈差不多"这样的等级序列,而在英语中则首先明确该词汇的不同对译方式,进而对各对译方式的句法语义特点进行区分辨别。
-
-
-
彭石玉;
周丹
-
-
摘要:
基于中英新闻导语在消息来源位置、导语长度和撰写方式的差异,提出调整消息来源位置、调整导语要素顺序、提前翻译术语和运用解释性翻译四种译前编辑方法。这不仅丰富了译前编辑研究方法,而且有助于机器翻译软件更好地理解源文本,从而提高机器翻译新闻导语译文质量和效率。
-
-
闫雪芹;
左仕琪;
郑春萍
- 《第22届全球华人计算机教育应用大会》
| 2018年
-
摘要:
本研究选取1998-2017年间CSSCI检索源期刊中有关机器翻译的165篇论文,采用分类汇总和内容分析法梳理了过去20年间国内相关研究研究内容及其特点.随后,针对25篇与机器翻译与教学实践直接相关的文献开展了进一步的内容分析.研究发现研究内容跨越了翻译学、情报科学、语言学与计算机科学等多个学科领域,而机器翻译技术的研发与改进以及机器翻译的教学实践是该领域的研究热点.随着我国对高层次翻译人才需求的日益增长,我国机器翻译的教学实践研究主要围绕教学模式改革和人才培养展开.本文有利于机器翻译实践者与研究者直观了解我国机器翻译的研究热点,为后续研究与教学实践提供启示.
-
-
-
-
-
周毛克;
龙从军
- 《中国民族语言学会民族语文应用专业委员会首届学术研讨会》
| 2017年
-
摘要:
随着近几年藏汉机器翻译研究逐渐升温,把握好藏汉机器翻译领域的正确研究方向显得尤为重要.本文介绍了机器翻译的产生及其发展历史,阐述了它的研究现状及难点,同时通过语言的文化背景、语法及语篇的上下文联系等角度指出了藏汉机器翻译系统目前存在的问题.经过调查也发现现存主流的藏汉机器翻译系统也就三个分别是西藏大学的阳光藏汉机器翻译,中国科学院软件研究所和中国社会科学院民族学与人类学研究所语言应用研究所藏汉机器翻译系统以及沈阳雅译网络技术有限公司的小牛翻译,这三个是目前比较权威和实用的机器翻译系统。由于诸多的方法理论各有利弊,系统也各有优劣,所以在今后的研究中我们可以将这些方法结合起来,例如将基于统计和基于规则的机器翻译技术结合起来,或者是将其他语言的机器翻译方法与技术结合藏汉机器翻译技术从而加快藏汉机器翻译的发展速度。
-
-
张睿
- 《2017年西南三省一市(贵州、重庆、四川、云南)自动化与仪器仪表学术年会》
| 2017年
-
摘要:
针对传统基于短语的机器翻译中采用的精确匹配策略导致翻译出的短语存在稀疏性的问题,引入相似度解决翻译后短语的稀疏性问题.对此,文章首先结合机器翻译的原理进行分析,并指出传统短语翻译存在的问题;其次,提出短语相似度统计模型,在对训练的语料库进行训练时,对其中没有出现过的短语,通过计算短语之间的相似度的方式,并改变传统的精确匹配方式,而采用模糊匹配策略,从短语表中查找相似度较高的实例短语,最后这些实例短语,构造汉英翻译句子;最后,对上述的算法进行了实验验证.结果表明,极大的提高了翻译的质量.
-
-
-
ZHANG Kai;
张凯;
LI Junhui;
李军辉;
ZHOU Guodong;
周国栋
- 《第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2018)》
| 2018年
-
摘要:
当前图像描述生成的研究主要仅限于单语言(如英文),这得益于大规模的已人工标注的图像及其英文描述语料.该文探索零标注资源情况下,以英文作为枢轴语言的图像中文描述生成研究.具体地,借助于神经机器翻译技术,该文提出并比较了两种图像中文描述生成的方法:串行法,该方法首先将图像生成英文描述,然后由英文描述翻译成中文描述;构建伪训练语料法,该方法首先将训练集中图像的英文描述翻译为中文描述,得到图像-中文描述的伪标注语料,然后训练一个图像中文描述生成模型.特别地,对于第二种方法,该文还比较了基于词和基于字的中文描述生成模型.实验结果表明,采用构建伪训练语料法优于串行法,同时基于字的中文描述生成模型也要优于基于词的模型,BLEU_4值达到0.341.
-
-
张檬;
刘洋;
孙茂松
- 《人工智能领域青年学者研讨会》
| 2017年
-
摘要:
在进行跨语言自然语言处理时,缺少双语资源是非常棘手的问题,而这在语言资源匮乏的场景下是非常普遍的.此时,利用好非平行语料中蕴含的翻译知识变得更为重要.由于语料不平行,从中获取翻译知识意味着小数据、无监督学习,因此极具挑战,而取得的结果通常是双语词典的形式.这既是人工智能领域重要的学术问题,也在语言资源匮乏场景有着巨大的应用价值.本文针对前人研究中存在的问题,介绍一系列工作,从各个角度探索如何更好地利用非平行语料构建双语词典.
-
-
张檬;
刘洋;
孙茂松
- 《人工智能领域青年学者研讨会》
| 2017年
-
摘要:
在进行跨语言自然语言处理时,缺少双语资源是非常棘手的问题,而这在语言资源匮乏的场景下是非常普遍的.此时,利用好非平行语料中蕴含的翻译知识变得更为重要.由于语料不平行,从中获取翻译知识意味着小数据、无监督学习,因此极具挑战,而取得的结果通常是双语词典的形式.这既是人工智能领域重要的学术问题,也在语言资源匮乏场景有着巨大的应用价值.本文针对前人研究中存在的问题,介绍一系列工作,从各个角度探索如何更好地利用非平行语料构建双语词典.