首页> 中国专利> 一种机器与人工翻译相融合的口语翻译方法和装置

一种机器与人工翻译相融合的口语翻译方法和装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提出了一种机器与人工翻译相融合的口语翻译方法及装置。所述方法包括：识别连续的语音段落，并对其进行断句切分，得到以句子为单位的输入文本；根据所述输入文本进行数据库搜索，查找是否有对应的目标语句，若有则直接将目标语句以语音输出；使用机器翻译对所述输入文本进行翻译得到目标语句，并对所述目标语句进行置信度打分；由人工翻译所输入文本获得目标语句；根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估，并采用语音合成的方法将评估较好的翻译目标语句生成韵律可调的语音输出。

著录项

公开/公告号CN104050160A

专利类型发明专利
公开/公告日2014-09-17

原文格式PDF
申请/专利权人北京紫冬锐意语音科技有限公司;
展开▼

申请/专利号CN201410090457.6
发明设计人高鹏;
展开▼

申请日2014-03-12
分类号G06F17/28(20060101);G06F17/30(20060101);
代理机构11021 中科专利商标代理有限责任公司;
代理人宋焰琴
地址 100191 北京市海淀区学院路35号世宁大厦409室
入库时间 2023-12-17 01:14:57

法律信息

法律状态公告日

法律状态信息

法律状态
2017-04-05

授权

授权
2014-10-22

实质审查的生效 IPC(主分类):G06F17/28 申请日:20140312

实质审查的生效
2014-09-17

公开

公开

说明书

技术领域

本发明涉及计算机信息自动处理领域，具体涉及一种机器与人工翻译相融合的口语翻译方法和装置。

背景技术

自动翻译系统的研究开发已经进行了50年了——事实上自从本世纪 40年代电子计算机诞生之日起就开始了计算机应用于语音翻译的探索。从上个世纪80年代末期以来，人们开始致力于语音翻译(Speech-to-speech Translation)技术的研究。所谓的语音翻译就是让计算机实现从一种语言的语音到另一种语言的语音翻译的过程。其基本设想是，让计算机像人一样充当持不同语言的说话人之间翻译的角色。由于说话人使用的语言一般都是日常生活中的口语，而人们也正希望计算机翻译系统可以接受并实现任意口语语句的翻译，并且，这种希望随着语音识别技术和口语解析技术的快速发展和提高，已经成为不再渺茫的设想。因此，语音翻译又常被称作口语翻译(Spoken Language Translation，SLT)。

口语翻译涉及自动语音识别、机器翻译、语音合成等多种学科和技术，因此具有重大的研究意义。在上个世纪90年代早期，伴随着语音识别技术的不断提高，口语翻译逐渐蓬勃发展起来。随着其核心技术的不断发展，口语翻译不再是限定于某个领域内的高质量翻译，而要以实现不同语言之间的交流为目标。口语翻译中的研究侧重于以下几个方面：1)在交互式的语音翻译中挖掘对话结构；2)研究书面语与口语的不同；3)处理系统的性能和鲁棒性问题。近年来，随着语音识别中统计框架的建立，在机器翻译以及口语翻译中越来越多的系统开始使用统计方法进行建模。并且传统的口语翻译系统，由于受到技术限制，只能应用在某些语音受限的环境下，而当前技术的主要挑战是如何解决现实生活中的口语交流问题。具体的应用场景从国际会议(包括体育运动会)信息综合服务到旅游信息咨询等，因此从社会与经济的角度来看，口语翻译(SLT)与我们这个日益全球化的世界有很大的相关性。

口语信息表达作为人们日常交流的一种主要沟通方式，语言表达的简洁性和使用范围的广泛性越来越受到人们的重视。开发基于口语信息内容处理的机器翻译系统，在便于使用和携带的嵌入式系统平台上应用成为人们开发实用性机器翻译系统的一个重要内容。但是，口语自身的一些特点使得实用性口语翻译系统的研发困难重重。口语翻译的主要困难在于1) 在口语对话、网络聊天等真实场景中，输入的句子往往缺乏规范性，很难扑捉其内在的语法结构信息，造成统计翻译的结果较生硬、稳定性差等问题；2)统计机器翻译是以数据驱动的，其赖以生存的根基是双语数据资源。而在当前的数据积累中，面向口语的双语语料(中英)相当匮乏。因此目前，完全依赖统计方法的口语翻译系统并不能完全满足人们日常生活的广泛需求。3)口语翻译有别于文本翻译，其主要完成不同语言的人群的交流问题，因此其对翻译的实时性要求高，尤其在网络环境下如何优化翻译流程是提高用户体验的关键。

发明内容

本发明旨在提供一种机器与人工翻译相融合的口语翻译方法，可以解决单纯使用机器进行口语翻译，其结果生硬、稳定性差等问题，并通过不断积累以句子为单位的大规模口语翻译数据库，提高翻译的自动化程度，加速口语翻译系统的市场化进程。

根据本发明一方面，其提供了一种机器与人工翻译相融合的口语翻译方法，包括：

步骤1、识别连续的语音段落，并对其进行断句切分，得到以句子为单位的输入文本；

步骤2、根据所述输入文本进行数据库搜索，查找是否有对应的目标语句，若有则直接将目标语句以语音输出，否则转步骤3；

步骤3、使用机器翻译对所述输入文本进行翻译得到目标语句，并对所述目标语句进行置信度打分；

步骤4、由人工翻译所输入文本获得目标语句；

步骤5、根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估，并采用语音合成的方法将评估较好的翻译目标语句生成韵律可调的语音输出。

根据本发明另一方法，其公开了一种机器与人工翻译相融合的口语翻译装置，包括：

语音识别与碎片化模块，识别连续的语音段落，并对其进行断句切分，得到以句子为单位的输入文本；

模版检索和替换模块，根据所述输入文本进行数据库搜索，查找是否有对应的目标语句，若有则直接将目标语句以语音输出，否则进入第一翻译模块；

基于层次短语的机器翻译模块，使用机器翻译对所述输入文本进行翻译得到目标语句，并对所述目标语句进行置信度打分；

智能的人工众包翻译模块，由人工翻译所输入文本获得目标语句；

质量评估模块，根据所述机器翻译的翻译置信度评估以及人工翻译的质量进行评估，并给出判定的最后翻译结果；

语音合成输出模块，采用语音合成的方法将质量评估模块判定出的最后翻译结果生成韵律可调的语音输出。

本发明提出的上述方案中所述将不同翻译方法的结果以语音合成的方式统一传递给用户，满足了语音交流的实时性需求。为形象传递源语言用户情感，本识别方法通过识别用户情感并以图示或者合成的方式展现给目标语言用户，提高用户应用场景下的体验。

本发明通过段落断句实现了以句子为单位的人工高质量翻译语料的入库和有效利用，克服了传统人工意译数据难以被统计翻译方法利用的问题；本发明通过语音合成将不同翻译方法的结果都稳定得输出为包含情感的语音，能够很好的解决语音翻译中的实时沟通问题；本发明可以解决海量移动用户在日常生活、旅游、学习、简单对话等场景下的口语翻译问题，加快口语自动翻译技术的市场化，具有非常重大的实用意义。

附图说明

图1为本发明提出的机器与人工翻译相融合的口语翻译方法流程图；

图2为本发明对字符串“ABCDEFGH”进行语句切分的示意图；

图3为本发明所能预见到的未来2年内的用户增长曲线图；

图4为本发明中翻译置信度评估方法的流程示意图；

图5为本发明提出的机器与人工翻译相融合的口语翻译装置模拟图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明作进一步的详细说明。

参见图1，根据本发明机器翻译与人工众包翻译相融合的口语翻译方法的流程如下：

S11：通过终端设备输入源语言的语音，将输入的连续语音以语音的自动识别、标点符号的自动添加等为核心进行切分断句，得到翻译所需的以句子为单位的输入文本；

S12：每一句文本语料输入系统之后，首先在翻译数据库中进行检索，如果匹配成功，输出检索到的翻译文本，并跳转到步骤S17；

S13：若无法检索到相应数据，则启动智能管理模块，通过计算输入句子的复杂度，并结合用户的等级情况决定是否启用人工翻译，同时将数据送入机器翻译模块；

S14：基于层次短语的统计机器翻译方法，融合强制对齐的参数训练结果进行翻译置信度评估；

S15：如果决定启用人工翻译，则使用人工众包翻译的方法，并在后台使用可视化终端使译员能够完成逐句的文本翻译；

S16：根据翻译置信度对机器翻译结果与人工翻译结果进行综合评估，输出较优的翻译文本结果；

S17：将输出的翻译文本生成质量稳定的语音输出，可形象传递用户情感，能够很好地解决面对面实时翻译的实际需求。

下面通过实施例二详细说明上述方法步骤。

步骤S11中连续语音的碎片化处理方法

在线连续语音识别中，语音会源源不断的输入到语音识别模块中。尽管特征变换和每帧语音的后验概率可以实时的计算，但解码器和内存却无法承受如果长的语音数据。因此在线连续语音识别中对语音的断句切分非常重要，它不仅是系统稳定运行的保障，而且对系统的识别性能有至关重要的作用。传统的在线连续语音识别是根据语音中的静音长度来切分的。这样切分在朗读或是新闻语音中会有比较好的效果，但是遇到自然的语音识别效果就会骤然下降。因为在自然的说话中，一句话中间停顿也是普遍存在的现象，而根据静音切分就会在停顿的地方切分断句。这样会造成停顿前后两个语音片段的识别都会出现错误。此外，在自然的说话中，由于情绪的波动导致很多句话连续说出，中间甚至不包含一个停顿。利用静音来断句的方法无从检测这种切分，进而会影响到语音的识别效果。

我们的在线连续语音识别采用的是以识别率为核心的切分断句方法，切分是在不损失识别率的前提条件下进行的。这样的切分方法能够对自然语音中的断句进行自动的判断。

图2示出了本发明对字符串“ABCDEFGH”进行语句切分的示意图。如图2所示，假设一段语音，根据声学模型和语言模型得分进行搜索，结果为ABCDEFG。接下来的一个字符为H，考虑是都需要进行切分断句有下图中的两种情况。

第一种情况下认为此处应该切分，即图中上面一条路径，那么语言模型的概率为：

$P_{1} = P_{h} \times P (w_{n + 1} = < \ s | W_{n}^{n - x}) \times P (w_{1} = H | < s >) - - - (1)$

其中w=w₁w₂....w_n代表长度为n的字符串，x表示x元语言模型。在本例中字符串为ABCDEFG，长度为7。P_h是已识别字符串ABCDEFG的历史概率，这是两种情况的起始状态。是已识别字符串最后字符G为句尾的概率。P(w₁=H|<s>)是第一个未识别字符H作为一句新的语句的开始的概率。

第二种情况是此处不切分，就是图中下面的一条路径，语言模型的概率为：

$P_{2} = P_{h} \times P (w_{n + 1} = H | W_{n}^{n - x}) - - - (2)$

其中P_h是公式(1)中是一样的。是字符H跟在字符G后面的概率。

比较两种情况下的语言模型概率，如果P₁＞P₂，那么我们才认为此处应该切分，从H开始另外一句话。否则这句话还没有结束，H紧跟在G 的后面形成新的字符串ABCDEFGH，然后对后面的字符I进行相同的处理。这种方法不但能够排除一句话中的停顿带来的虚警，而且能够避免在没有停顿的连续语音中的漏报，从而使识别率达到最好。另外这种切分方法不依赖于静音，从而也避免了静音检测不准确带来的误切分。

步骤S12中，大规模翻译数据库检索方法

该翻译数据库存储着经过人工翻译或者人工校对的高质量翻译结果。该数据库在系统中承担了两项任务：

当文本语料经过碎片化处理之后，首先在翻译数据库中进行检索，如果匹配成功，则立即返回结果。这里的匹配是通过计算句子之间的相似度实现的。所谓句子相似度指两个句子在语义上的匹配符合程度，值为[0， 1]之间的实数，值越大表明两个句子越相似。当取值为1时，表明两个句子在语义上完全相同；值越小则表明两个句子相似度越低，当取值为0 时，表明两个句子在语义上完全不同。这里我们主要采用融合语义信息的基于向量空间模型的TF-IDF方法计算句子相似度。由于口语缺乏规范的语法结构等信息，我们很难扑捉输入文本的句法语义结构。因此，此处的语义信息主要包括时间、数字、命名实体等浅层语义信息，并在此基础上进行替换生成翻译模板对输入文本进行匹配。

由于统计机器翻译系统是语料驱动的，其性能跟输入的语料密不可分。特别地，我们的翻译数据库搜集的是实时的，准确的线上语料，对机器翻译系统来说，随着这部分数据规模的不断增大和完善，系统性能必将不断优化。

步骤S13中，智能协同的方法

若输入句子在翻译数据库中没有检索到，我们得系统启动智能协同模块，根据实际用户的类别，综合输入文本的复杂度计算结果，决定是否由译员人工完成翻译。

该系统设定的用户交纳费用的多少，分为免费用户、普通用户(交纳少量费用的使用者)、高级用户(对系统的准确性有较高要求的使用者)三种类别。

图3展示了该系统所能预见到的未来2年内的用户增长曲线。由图3 可见，在开发初期，主要是以吸纳免费用户、搭建完善智能翻译平台为主，随着用户数目的增长，结合智能翻译平台自身的优化更新能力，越来越多的付费用户将被吸引。另外，智能管理模块还控制着将较优的翻译结果添加到数据库中，以保证数据库的持续更新。待其积累至一定规模之后，可将该部分语料添加到统计翻译系统中，对翻译模型及语言模型进行更新，进而使得整个翻译系统随着实时语料的注入保持不断优化。因此，随着系统处理数据规模的增长，数据库检索及机器翻译等自动模块所能够完成的翻译任务所占比例逐步增加，这在很大程度上可以降低人工翻译的成本，提高系统效率。

步骤S14中，基于层次短语的统计机器翻译方法，融合强制对齐的参数训练结果进行翻译置信度评估。

针对口语翻译，使用基于同步上下文无关语法(synchronous context-free grammar，SCFG)的层次化短语统计机器方法。基本思想是从大规模双语语料库中抽取海量对齐短语片断，作为知识源“记忆”在存储介质上。对语音识别出的输入文本利用高效的搜索算法匹配短语片段并组合成要翻译的句子。并且建立一种融合基于强制对齐模型参数训练的置信度计算方法，重点研究翻译概率特性带来的翻译不确定性，最终为每个目标语言的翻译结果生成置信度打分。

基于层次化短语的统计机器模型建立在同步上下文无关语法 (synchronous context-free grammar，SCFG)，属于形式化句法的范畴。基于层次化短语的统计翻译系统具有基于形式化句法的统计机器翻译的一般特点：借用了形式化句法的结构，从而使得翻译过程是层次化的，是有结构的。因此，它可以将句子中的长距离调序变成局部调序；而且可以在树的结构中引入变量解决泛化等问题。同时，与引入语言学句法的统计翻译系统相比，形式化句法具有不需要额外的句法分析资源、完全兼容短语系统等优势。特别地，在口语对话，网络聊天等真实场景中，输入句子往往不规范，与真正的书面语言句子有一定的差距，这使得句法分析的性能受到很大影响。如果在这样的环境里构建基于语言学语法的统计机器翻译系统，其性能就会因为句法分析性能低而大打折扣。但是，基于形式化语法的统计机器翻译在这样的语言环境里，性能则不会受到太大影响，因为形式化语法模型在这方面仍然具有短语模型的优势。下面介绍一下具有置信度翻译结果输出的层次短语翻译方法：

1)层次短语翻译

在基于层次短语的翻译方式下，解码器的任务是寻找最优的目标语言串满足

$\hat{e} = e ({\arg \max}_{D_{s . t .} f (D) = f} P (D))$

其中e代表目标语言串，D代表经过一系列推导生成目标串的过程。也就是说，能够找到一个生成源语言串的最佳句法推导过程D，在D中同步文法的目标语言端生成的目标语言串，就是最终的翻译。需要注意的是，我们这里寻找的是概率最大的推导过程而不是概率最大的目标语言串，因为可能有多种推导过程都能够生成同样地目标语言串，所以寻找概率最大的目标语言串计算代价更高。

按照对数线性模型，概率P(D)可以认为是多个特征的对数线性组合：

$P (D) \propto \underset{i}{Π} Φ_{i} {(D)}^{λ_{i}}$

其中Φ_i和λ_i是第i个特征函数及其对应的权重。除了语言模型特征P_LM以外，其他用到的特征都可以写成规则乘积的形式：

$φ_{i} (D) = \underset{(X \to < γ, α >) \in}{Π} φ_{i} (X \to < γ, α >)$

其中X→<r，a>代表层次短语系统推导过程中用到的一系列上下文无关文法，因此可以重写P(D)为：

$P (D) \propto P_{LM} {(e)}^{λ_{LM}} \times \underset{i \neq LM}{Π} \underset{X \to (α, γ) \in D}{Π} Φ_{i} {(X \to (α, γ))}^{λ_{i}}$

传统的统计翻译系统，如Pharaoh，采用beam search，A*等线性解码算法，虽然可以融入简单的调序模型和N-Gram的语言模型，但翻译结果的语序总是差强人意。然而基于层次短语的翻译系统前端结合了树的结构信息，后端的解码算法相应也要利用树的分析算法。所以本发明借鉴基于线图分析的句法分析方法，实现了CYK-Style的解码器。

CYK算法是改进的自底向上移进-规约算法。在解码过程中会产生大量的假设，为了避免搜索所有的可能，我们采用了堆栈结构，并利用不同的策略在搜索过程中进行必要的剪枝。建立addEdge函数对于每个要进入线图(chart)的边，首先检查它是否能通过阈值(threshold)剪枝，如果通过则检查该边是否要重新归并(recombination)，最后检查它是否能通过柱状图(histogram)剪枝。只有成功通过了这三种剪枝的边，才能最后存贮到线图中。

2)融合基于强制对齐模型参数训练的翻译置信度评估方法

通常意义下，置信度是评价一个正确概率的量度，它反映了某一特定事件发生的可靠程度。在机器翻译中，它表示为在事先没有参考答案的条件下，对给定输入的翻译结果评价评估。在该系统中，我们不仅利用一些翻译系统外部信息比如源语言／目标语言的困惑度，长度等，还将翻译过程中的各种信息融合进来，更好地模拟人对翻译结果的评分。

图4示出了本发明中翻译置信度评估方法的流程示意图。如图4所述，在基于强制对齐模型参数训练的翻译置信度评估方法中，首先利用强制对齐技术完成模型的参数训练，并保留对齐过程中的概率等信息；同时，我们将源语言串S和目标串T的困惑度和长度等知识作为特征融入到置信度的评估中。通过机器学习，可以将多种信息融合到一个统一的框架中，并最大限度地模拟目标函数。在本系统中，我们使用了支持向量回归 (Support Vector Regression，SVR)作为机器学习工具。这是由于SVR的目标函数能够很好地近似我们提出的目标-模拟翻译结果的人工评分。

步骤S15中，人工众包翻译方法：

1)人工众包翻译

众包(Crowdsourcing)，指一个公司将工作任务以自由自愿的形式外包给非特定的大众网络的做法，是一种基于互联网的社会化协作模式，能够嵌入企业经营活动的各个环节，形成新的组织形式。这个概念是美国知名IT杂志《连线》提出，被业界称为继“长尾理论”之后又一个重要的商业概念。该发明在组织人工翻译这个环节采用众包模式，组织起有一定口语翻译能力的各路人才，利用群体智慧创造出人人受益的社会新事物。

虽然众包翻译这个概念已被提出，也有译言、虎扑、果壳等网站执行众包模式的文章和图书翻译社区，但这些社区型媒体网站的主要翻译对象是时政新闻、体育赛事等网络上实时传播的文本信息，通常由一些论坛资深网友和网站员工来寻找合适原文，并对“翻译团”网友的水平和分工进行把握。该发明中的众包翻译面向的是日常生活中相互交流的口语信息，并经过了碎片化处理。因此，相比于新闻等书面文本的众包翻译，该发明提出的口语众包翻译有以下几点优势：

口语信息表达的内容以现实生活中沟通交流为目的，因此需要更“人性化”的翻译结果。众包翻译可以利用群体的力量，不仅降低了研发、经营、人力的成本，也让翻译结果更加贴近用户需求。

口语信息表达的内容涉及人们的衣、食、住、行等多个方面，在这里使用众包翻译，可以汇聚更多的非专业翻译人才，充分体现群体智慧的优势。

在可视化终端上，译员面对的是碎片化后的文本信息。通常，译员擅长于向设置良好的问题提供建议，并为有针对性的问题提供翻译答案，因此这样的设置更有利于译员进行实时、高效的翻译。

通过将碎片化的语料显示在移动终端(ipad、手机)上，供译员进行翻译、编辑等，最后译员可以选择将翻译结果以语音方式输入终端，实现实时翻译的目的。

2)译员终端

在后台使用可视化终端使译员能够完成逐句的文本翻译，该发明降低了译员的难度，减少了人工翻译的代价，同时保证了实时翻译的需求，主要体现在以下几个方面：

在后台将碎片化的文本直接显示在可视化终端上，译员面对的不再是冗长的、连续的语音，取而代之的是碎片化及可视化的文本信息。一方面，碎片化的文本以句子为单位，译员不再需要记忆多句乃至整段的信息，并且降低了对译员综合概括能力的需求；另一方面，将输入信息转换成可视化文本，译员可以简单快捷地将看到的文本信息翻译成目标语言。这种工作方式放宽了对译员各种能力的需求，使得一些“非专业”翻译人才也可以快递融入进来，极大地提高了系统的适用范围。

通过设定当前任务的不同状态高亮显示需要人工翻译的文字，如可以在终端上用不同颜色表示数据是否被检索，是否被机器翻译以及是否需要人工翻译。当需要人工翻译时，可以使用高亮显示以区别于其他状态。这种高亮显示特定状态的方法使得译员可以方便、快捷地完成文本的逐句翻译，降低了译员的难度，减少了人工翻译的代价。

最后由于我们出色的语音识别系统，译员可以选择将翻译结果以语音方式输入终端，由其内嵌的语音识别组块自动转换为文字。这里不再需要逐字录入翻译结果，减少了人工劳动的时间，提高了工作效率。

步骤S16中，对自动翻译和人工翻译进行综合评估的方法：

当完成自动翻译和人工翻译之后，所有结果输入该模块进行质量评估综合输出。该模块根据自动翻译的置信度打分，各个译员的级别打分等信息，并借鉴自动翻译评价标准BLEU计算方法，对不同翻译方法的结果进行综合评估，将较优的结果返回给语音合成模块。

图5示出了本发明提出的机器与人工翻译相融合的口语翻译装置模拟图。如图5所示：

S11：通过终端设备(如手机)输入源语言的语音，将输入的连续语音以语音的自动识别、标点符号的自动添加等为核心进行切分断句；并得到翻译所需的以句子为单位的输入文本；

S12：每一句文本语料输入系统之后，首先在翻译数据库中进行检索，如果匹配成功，输出检索到的翻译文本，在经过质量评估之后，直接输出翻译文本的语言合成结果；

S13：若无法检索到相应数据，则启动智能管理模块，通过计算输入句子的复杂度，并结合用户的等级情况决定是否启用人工翻译，同时数据将送入机器翻译模块；

S14：基于层次短语的统计机器翻译方法，融合强制对齐的参数训练结果进行翻译置信度评估；

S15：如果决定启用人工翻译，则使用人工众包翻译的方法，并在后台使用可视化终端(ipad或其他电脑)使译员能够完成逐句的文本翻译；

S16：根据翻译置信度对机器翻译结果与人工翻译结果进行综合评估，输出较优的翻译文本结果；

S17：将输出的翻译文本生成质量稳定的语音输出，语言表达能够很好地解决面对面实时翻译的实际需求。

本发明还提出了一种语音识别及口语翻译转换装置，其包括：

语音识别与碎片化模块：能够对连续语音进行自动语音识别、自动标点添加，形成句子为单位的待翻译文本；

大规模翻译数据库的模版检索和替换模块：采用融合语义信息的基于向量空间模型的TF-IDF方法完成口语翻译例句的大规模数据库检索和利用浅层语法信息完成翻译数据的部分内容替换，增强数据库的泛化性量方面的功能；

智能管理模块：主要功能是通过计算输入句子的复杂度，并结合用户的等级情况决定是否启用人工翻译，同时数据将送入机器翻译模块。同时，其还能够持续搜集、整理人工众包翻译的结果，形成高质量的翻译数据库用以提供高效地检索服务，并为机器翻译模型更新优化提供优质的双语语料；并随着翻译数据库的不断积累及机器翻译系统的日益完善，逐步增加数据检索及机器翻译的比例，实现了整个翻译系统的动态更新及优化；

基于层次短语的机器翻译模块：包含翻译模型、语言模型和解码器三部分其基本思想是从大规模双语语料库中抽取海量对齐短语片断，作为知识源“记忆”在存储介质上。对用户键入的中文句子，利用高效的搜索算法匹配短语片段并组合成要翻译的英文句子。本发明还在其上建立了一种融合基于强制对齐模型参数训练的置信度计算方法，重点研究翻译概率特性带来的翻译不确定性，最终为每个目标语言的翻译结果生成置信度打分。

智能的人工众包翻译模块：采用众包的方式吸引具有口语能力并愿意将其转化为市场价值的翻译人才，形成汇聚该类人才的服务型社区，并通过智能平台分包业务，提供即时人工口译服务；并且将碎片化的语料显示在移动终端(ipad、手机)上，供译员进行翻译、编辑、评价、回传。可视化终端，使译员能够实时完成逐句的文本翻译包括：在后台将碎片化的文本直接显示在可视化终端上，译员不再直接面对连续的语音以及文字，这在很大程度上降低了对译员的听力、记忆力以及概括能力的特殊需求；通过设定当前任务的不同状态高亮显示需要人工翻译的文字，使得译员可以方便、快捷地完成文本的逐句翻译，降低了译员的难度，减少了人工翻译的代价；最后，翻译完成后，译员不再需要逐字输入文本，可以选择通过终端设备完成语音输入，并由其内嵌的语音识别模块自动转换为文字提交给系统，这将极大提高译员的工作效率。

质量评估模块：通过分析数据库检索的结果和机器翻译装置提供的执行度打分，并综合人工众包翻译中可能反馈回的翻译结果、翻译时间、译员等级等信息以及适配用户等级这些多方面信息的结果下，对各个结果进行综合的判定，并给出判定的最后翻译结果。

语音合成模块：通过语音合成的方式将翻译结果进行输出。为形象传递源语言用户情感，本识别方法通过识别用户情感并以图示或者合成的方式展现给目标语言用户，提高用户应用场景下的体验。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种机器与人工翻译相融合的口语翻译方法和装置 [P] . 中国专利： CN104050160B . 2017.04.05
2. 一种机器与人工翻译相融合的口语翻译方法 [P] . 中国专利： CN113515956A . 2021-10-19
3. A method and apparatus for example-based spoken language translation with examples having grades of specificity [P] . AU2042900A . 2000-08-18

机译：一种基于示例的口语翻译方法和装置，其中示例具有特定等级
4. A fusion device for the manufacture of fibers, threads and other products in any form. (Machine-translation by Google Translate, not legally binding) [P] . ES369886A1 . 1971-12-01

机译：一种用于制造任何形式的纤维，线和其他产品的融合装置。（通过Google翻译进行机器翻译，没有法律约束力）
5. A device for the extraction of the different liquid phases of the inside of the drum of the horizontal axis centrifuges. (Machine-translation by Google Translate, not legally binding) [P] . ES387131A1 . 1973-05-01

机译：一种用于提取水平轴离心机转筒内部不同液相的装置。（通过Google翻译进行机器翻译，没有法律约束力）