首页>中文会议>工业技术>自动化技术与计算机技术>第七届全国机器翻译研讨会

第七届全国机器翻译研讨会

召开年：2011
召开地：厦门
出版时间： 2011-09-23

主办单位：中国中文信息学会

会议文集：第七届全国机器翻译研讨会论文集

会议论文

热门论文

全部论文

最新会议

更多>>

全选（0）

1.多语言文本机器翻译系统-中科院自动化所CWMT2011评测技术报告
- 周玉;翟飞飞;张家俊;涂眉;陈钰枫;宗成庆
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文是中科院自动化所参加CWMT2011机器翻译系统评测的技术报告。在本次评测中我们一共参加了九个项目的评测任务，包括汉英新闻领域机器翻译、英汉新闻领域机器翻译、英汉科技领域机器翻译、日汉新闻领域机器翻译、蒙汉日常用语机器翻译、藏汉政府文献机器翻译、维汉新闻领域机器翻译、哈萨克斯坦语-汉语(哈汉)新闻领域机器翻译、柯尔克孜语-汉语(柯汉)新闻领域机器翻译。文章主要介绍了各评测任务的系统框架、模型、实现方法及评测结果。
2.CWMT2011东北大学参评系统NiuTrans介绍
- 肖桐;张浩;李强;路琦;朱靖波;任飞亮;王会珍
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了东北大学自然语言处理实验室(NEUNLPLab)开发的NiuTrans机器翻译系统参加第七届全国机嚣翻译研讨会(CWMT2011)机器翻译评测任务的情况。在本次评测中，NEUNLPLab在所有九项翻译子任务中均提交了结果。本文描述并分析我们在这次评测中对NiuTrans系统的各项改进工作,主要包括：对树到树翻译的搜索和建模的改进，对语言模型的改进和对各种特征的使用情况的研究。
3.第七届全国机器翻译研讨会(CWMT2011)富士通研究开发中心技术报告
- 李贤华;郑仲光;孟遥;于浩
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了富士通研究开发中心参加2011年第七届全国机器翻译研讨会的评测情况。今年FRDC参加了两个项目：英汉科技领域的机器翻译以及日汉新闻领域的机器翻译。本文介绍了FRDC做统计机器翻译的主要情况、本次参加评测所采用的系统情况，语料情况、在开发集和测试集的实验结果。并对实验结果进行了分析与总结。
4.北京交通大学CWMT2011评测技术报告
- 蒋俊杰;徐金安;张玉洁
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了北京交通大学自然语言处理研究组(BJTU-NLP)参加CWMT2011评测的情况。本次评测,我们一共参加了英汉新闻、汉英新闻、英汉科技等三个项目的机器翻译评测任务。文章主要介绍了我们参加各个评测任务的系统框架、模型及评测结果。
5.中国科学技术信息研究所CWMT2011技术报告
- 何彦青;石崇德;于薇;张均胜;王惠临
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了中国科学技术信息研究所(ISTIC)参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。本文阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现。
6.第七届机器翻译研讨会NTT技术报告
- 吴先超;须藤克仁;Kevin Duh;琢田元;永田昌明
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文主要介绍NTT Communication科学基础研究所协创情报研完部言语智能研究组参加2011年第七届全国机器翻译研讨会(CWMT2011)评测的情况。本单位参加了全部测评项目中的两个子项：英汉科技领域机器翻译和日汉新闻领域机器翻译。本文首先简要地介绍本单位的统计机器翻译系统的实现框架，其次比较各个系统在评测数据上的性能表现，最后对翻译评测的结果加以简略分析。
7.新疆大学CWMT2011评测技术报告
- 麦热哈巴．艾力;米日古．肉孜;撒依达;江阿古丽;吐尔根．伊布拉音
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文主要介绍了我们参加CWMT2011研讨会的参评系统和技术报告，我们参加的项目是面向新闻领域的维汉机器翻译、面向新闻领域的哈汉机器翻译以及面向新闻领域的柯汉机器翻译等三个项目。本文中详细的介绍了系统的主要流程以及细节。
8.第七届全国机器翻译研讨会(CWMT'2011)DCU技术报告
- 吴晓锋;李军辉;江杰;贺一帆;Andy way
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了都柏林城市大学(DCU)在第七届全国机器翻译研讨会(CWMT’2011)上的参赛系统。该系统由基本短语翻译系统、层次短语翻译系统、系统融合三部分组成。本系统在日中新闻子任务中取得了较好的成绩。
9.第七届机器翻译研讨会厦门大学技术报告
- 胡金铭;甘兴超;陈毅东;史晓东
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文主要介绍了厦门大学参加2011年第七届全国机器翻译研讨会(CWMT2011)评测的情况。本单位参加了全部9个评测项目中的3个子项：汉英新闻领域机器翻译，英汉新闻领域机器翻译和藏汉政府文献机器翻译三个评测项目。文章将简要介绍本单位统计机器翻译系统的实现框架、模型以及阐述它们在评测数据上的性能表现，并针对结果加以适当分析.
10.第七届全国机器翻译研讨会中科院智能所评测技术报告
- 梁芳丽;陈雷;李淼;何绵涛;刘绘
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文详细描述了中国科学院合肥物质科学研究院智能机械研究所参加的第七届全国机器翻译研讨会(CWMT2011)评测中的第7个项目--维汉新闻领域的翻译评测系统。在评测中我们共使用了四个翻译系统：基本系统是一个标准的基于短语的统计机器翻译系统；第一个对比系统是融入了源语言形态信息的短语翻译系统，利用递推式的最小描述长度原理对源语言进行非监督式的形态切分，并结合逆向最大匹配词缀的方法获取形态信息；第二个对比系统是利用最小错误率方法调整参数权重的短语翻译系统，采用3轮遮代循环、每轮10次的方法进行参数权重的调整；第三个对比系统是采用二进制解码的层次短语翻译系统。
11.一种基于状态转移的N元语言模型快速查询方法
- 付晓寅;魏玮;徐波
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：融合基于海量语料的语言模型是提高统计机器翻译系统性能的有效手段。随着模型规模的不断增加，如何实现语言模型的快速查询成为影响系统性能的关键。本文根据N元语言模型查询具有的上下文相关特性，提出—种基于状态转移的语言模型快速查询方法。该方法通过构造Trie树索引保存查询状态，有效避免了语言模型的重复查询。实验结果表明，该方法在严格控制语言模型规模的基础上，能够显著提高统计机器翻译系统的解码效率。
12.日语提示助词“こそ”的日中机器翻译规则
- 韦燕;卜朝晖
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：机器翻译是使用计算机将一种语言转换成另一种语言的一门新学科，它涉及计算机科学、数学、语言学、翻译学等领域。语言研究可以促进机器翻译的发展，与此同时机器翻译的研究也可以促进语言研究的发展。日语提示助词不仅在语义和语法上呈现多样性，而且其汉语译词也呈现了多样性和复杂性，是日中机器翻译的一个难点。本课题主要探讨了日语提示助词“こそ”的语义、句法特征，及其与汉语译词的对应关系，并在此基础上制作了“こそ”的日中机器翻译规则，最后运用语料对此规则进行了人工检验，检测结果显示了规则的有效性。
13.统计机器翻译中多种语言模型的融合
- 奚宁;赵迎功;汤光超;李斌;罗春勇;戴新宇;陈家骏
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：在统计机器翻译系统中，目标语言的语言模型一般以词为基本单位。然而面对汉语、日语等存在不同分词标准、词语颗粒度不易确定、存在切分不一致和容易产生分词错误的语言来说，语言模型的单位难以取舍。本文研究了两种语言模型：基于词和基于字的语言模型，比较他们各自的优缺点，以比分析分词对语言模型质量的影响，然后提出方法将这两种语言模型融合到SMT解码中。实验结果表明，基于字的语言模型在测试集上的交叉熵要低于基于词的语言模型。当应用于SMT时，基于字的语言模型和基于词的语言模型相比，尤其在是语言模型领域和机器翻译测试语料的领域一致时，机器翻译的性能较高。而无论是否领域一致，融合两种语言模型总能得到最优的翻译结果。
14.面向短语的词语对齐方法
- 田亮;黄辉;周沁
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：自动词语对齐技术在统计机器翻译领域中起了很大的作用。然而，GIZA++训练得出的对齐结果并不是很令人满意。本文提出了一种基于最大匹配法(MMM)和GIZA++的词语对齐方法。首先，我们使用了最大匹配法分别把平行的英文和中文句子划分成单词和短语，然后通过词典和GIZA++的共同限制来产生对齐结果。实验表明，尤其是当平行句子中包含短语的时候，我们提出的对齐方法得出的对齐结果要比GIZA++产生的结果好的多。
15.第七届全国机器翻译研讨会(CWMT2011)评测报告
- 赵红梅;吕雅娟;贲国生;黄云;刘群
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：为了全面了解国内外机器翻译技术的现状，促进机器翻译技术的研究，按照惯例，第七届全国机器翻译研讨会(CWMT2011)继续组织了统一的机器翻译评测，以推进参评单位的实质性交流和机器翻译技术的发展。本文对第七届全国机器翻译研讨会的参评单位和语种进行了介绍，同时对评测过程、评测流程以及评测结果进行了阐述。
16.2011全国机器翻译研讨会计算所系统描述
- 刘凯;吕雅娟;刘群;王志洋;于惠;孙萌;宋林峰;李佳正;何晋一;孟凡东;刘洋
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了中国科学院计算技术研究所自然语言处理研究组参加2011年全国机器翻译研讨会机器翻译评测的情况。今年我们参加了所有领域的九项评测任务。使用了基于语言学句法、基于形式句法、基于短语等三类统计翻译模型的单系统。以及基于IHMM的词级融合系统与句子级融合系统。本文详细介绍了各个系统的理论模型和系统框架，并对评测相关实验进行了说明。
17.南京大学第七届机器翻译研讨会评测技术报告
- 奚宁;赵迎功;汤光超;李中华;刘友强;戴新宇;陈家骏
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍南京大学自然语言处理研究组(NJU-NLP)参加2011年第七届全国机器翻译研讨会(CWMT2011)评测的情况。本研究组参加了全部九个评测项目中的四个子项，分别是：汉英新闻领域单一系统,英汉新闻领域单一系统，英汉科技领域单一系统和日汉新闻领域单一系统。文章主要介绍研究组机嚣翻译系统的实现框架，阐述他们在评测数据上的性能表现，并对结果加以适当的分析。
18.ZZX_MT系统CWMT2011评测报告
- 巢文涵;李舟军
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了我们的机器翻译系统ZZX_MT参与CWMT2011的评测情况。本次评测中我们参与了两个任务，分别是：英-汉新闻翻译及英-汉科技翻译。我们将简单介绍系统的基本组成及其参与CWMT2011的英-汉新闻翻译及英-汉科技翻译的评测情况。
19.SYSTRAN混合策略汉英和英汉机器翻译系CWMT2011技术报告
- Jin Yang;Satoshi Enoue;Jean Senellart
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了SYSTRAN参加CWMT 2011机器翻译评测的汉英和英汉机器翻译系统。SYSTRAN系统的基本系统是融入了各种统计方法的基于规则的机器翻译系统。在规则系统翻译结果的基础上，我们用统计方法后编辑技术,使用提供的双语和单语语料，进行自动的后编辑。本文介绍了系统中运用的技术，训练数据和在CWMT2011中的评测结果。SYSTRAN汉英系统在评测中名习前茅。
20.CWMT2011哈工大机器智能与翻译研究室技术报告
- 梁华参;刘乐茂;于墨;刘宇鹏;胡鹏龙;李婷婷;张春越;曹海龙;赵铁军
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文详细介绍了哈尔滨工业大学机器智能与翻译研究室(HIT-MITLA)参加2011年全国机器翻译研讨会(CWMT2011)翻译评测任务的情况。在本次评测中，HIT-MITLAB共使用了5个翻译系统，它们分别是DINO，MUSES，KIMI，MOSES和MOSES_H，它们共参与了评测中5个子项目-汉英、英汉新闻领域，荚汉科技领域，日汉新闻领域和藏汉政府文献的翻译。在这5个子项目中HIT-MITLAB提交了共18个翻译结果。本文对参评的各个系统及其配置，数据的使用和处理进行了全面的描述，同时对各翻译的效果进行了比较和分析。
21.内蒙古师范大学CWMT2011蒙汉机器翻译系统评测技术报告
- 王春荣;宝美荣;王斯日古楞
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了内蒙古师范大学计算机与信息工程学院自然语言信息处理实验室参加CWMT2011机器翻译评测中的蒙汉日常用语评测情况。为了提高蒙汉统计机器翻译系统的性能，对蒙古语的格、数和领属附加成分进行切分处理，并提交了一个系统翻译结果。本文对参加评测的基于短语的蒙汉统计机嚣翻译系统进行了详细说明。
22.西安理工大学统计机器翻译系统技术报告
- 杜金华;王莎
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文主要介绍了西安理工大学参加2011年全国统计机器翻译研讨会机器翻译评测活动中所使用的统计机器翻译系统及相关技术。共计参加了2个翻译任务：汉英新闻翻译和英汉科技翻译.主要使用了3个单系统：Moses，Moses-chart和Joshua。另外，在英汉科技任务中使用了基于MBR的多系统融合框架。在数据处理方面，定义了两种噪声：格式噪声和语义噪声。针对此两种噪声，我们提出多种措施和方法对模型训练数据进行了深入的分析和净化，实验和评测结果表明，本文所提出的策略是行之有效的。
23.ISCAS机器翻译系统与评测技术报告
- 熊维;王震;于新;刘汇丹;诺明花;马龙龙;张立强;洪锦玲;吴健
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文介绍了中国科学院软件所基础软件国家工程研究中心多语言信息处理研究室参加CWMT2011机器翻译评测任务的情况。本次评测，我们主要参加了藏汉政府公文领域以及汉英新闻领域两个子任务，本文主要介绍我们此次参与评测的系统框架、实现细节、评测实验以及结果分析。
24.基于小规模俄汉双语词典的俄语形态切分
- 黄云;姜文斌;王志洋;祝捷;吕雅娟;刘群
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：俄语是一种形态丰富的语言，其形态切分相关语料较为缺乏或带有噪声，这些都为俄语的形态切分研究带来困难。我们将此问题建模为经典的序列标注模型，首先自动切分小规模俄汉双语词典提取出形素字典作为训练数据，然后针对这种语言特点训练了一个基于最大熵的标注模型。在联合国六国平行语料中抽取的7万俄汉对齐句对上进行的机器翻译实验证明，我们的方法使得BLEU值相对没有形态切分的基线系统提高了1.92%。
25.基于词的话题分布相似度的无监督日文旅游意见词翻译
- 郭瑛媚;史晓东;陈毅东;高燕
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文提出了一种无监督的方法自动获取日文意见词词义。通过分析意见词与其“邻居”的话题分布相似程度以及关联强度得到翻译结果。这种方法与传统的机器翻译方式不同，无需人工标注训练数据，仅仅利用在线中日词典和网络搜索引擎便可获得较好的翻译效果。试验结果表明，我们的方法能较准确的对意见词进行翻译，在词义较多时效果更为明显，能够帮助使用者了解日文内容，做出正确决策。
26.平仄信息对中文词法分析的影响
- 孟凡东;徐金安;姜文斌;刘群
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：词法分析，作为自然语言处理领域的基础性研究课题之一，其效果直接影响自然语言处理后续的工作。本文从汉语语音的特色出发，利用机器学习的方法，学习汉语句子中词语的平仄信息，研究平仄信息对词法分析的影响。并分别在人民日报语料和宾州中文树库语料上设计实验，实验结果证明了平仄信息特征确实能够大幅度提高中文词法分析的精度。
27.基于篇章上下文的统计机器翻译方法
- 于惠;谢军;熊皓;吕雅娟;刘群;林守勋
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：上下文信息对于统计机器翻译(SMT)中的规则选择是很重要的，但是之前的SMT模型并没有充分利用上下文信息。在本文中，我们提出了一种利用篇章上下文信息的方法来提高规则选择的准确性，从而提高翻译的质量。首先我们利用向量空间模型获得训练语料的文档和测试集中文档的相似度，然后把相似度作为一个新的特征加入到短语模型中。实验结果表明，在英语到汉语的翻译工作中，我们的方法可以显著提高翻译质量。在NIST-08和CWMT-08两个测试集上BuEU值都有显著的提高。
28.基于N-gram的无参考译文机器翻译自动评测方法
- 徐金安;蒋俊杰
- 《第七届全国机器翻译研讨会》 | 2011年
摘要：本文提出了一种无需参考译文的机器翻译自动评测方法，基本思想是利用源语言和目标语言的语言模型分别计算源语言句子和系统译文中所有n-gram的平均概率，再利用n-gram平均概率对系统译文进行打分。实验结果表明，本文方法与BLEU、NIST等自动评测方法的评测结果保持了很好的一致性。本文方法的主要贡献体现在普通用户可以在无参考译文的情况下，得到机器翻译系统译文的可信度，进而增强机器翻译自动评测的实用性。