首页> 中国专利> 机器翻译系统、机器翻译方法和与其一起使用的解码器

机器翻译系统、机器翻译方法和与其一起使用的解码器

摘要

本公开内容提供了机器翻译系统、机器翻译方法和与其一起使用的解码器。该机器翻译方法包括以下步骤:接收第一语言的文本;创建反映所述第一语言的文本中的每个短语组合的短语组合概率的短语组合模型;通过使用所述短语组合模型、翻译模型和语言模型将所述第一语言的文本翻译为第二语言的文本;将所述第二语言的文本作为翻译结果输出,其中,所述翻译结果包含被翻译短语。

著录项

  • 公开/公告号CN103823795A

    专利类型发明专利

  • 公开/公告日2014-05-28

    原文格式PDF

  • 申请/专利权人 佳能株式会社;

    申请/专利号CN201210464448.X

  • 发明设计人 那森;杨振东;

    申请日2012-11-16

  • 分类号G06F17/28(20060101);G06F17/27(20060101);

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人罗银燕

  • 地址 日本东京

  • 入库时间 2024-02-19 23:58:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-04-12

    授权

    授权

  • 2014-06-25

    实质审查的生效 IPC(主分类):G06F17/28 申请日:20121116

    实质审查的生效

  • 2014-05-28

    公开

    公开

说明书

技术领域

本发明大体上涉及自然语言处理,并且更特别地,涉及机器翻译 系统、机器翻译方法和与其一起使用的解码器。

背景技术

统计机器翻译是对于大词汇量文本翻译的有前途的方法。已提出 了许多统计机器翻译系统,诸如美国专利7340388、美国专利5477451 或美国专利7295962中的那些统计机器翻译系统。这些系统的基本原 理是:使用翻译模型来捕捉源语言与目标语言之间的对应关系,使用 翻译模型和语言模型来驱动解码器得到翻译结果。然而,这些系统没 有考虑短语组合问题。

还提出了如以下文献中的一些基于语法的机器翻译系统: [Yamada 2001]Kenji Yamada和Kevin Knight,“A syntax-based statistical translation model(基于语法的统计翻译模型)”,Proceedings of the ACL,2001;[Yamada 2002]K.Yamada和K.Knight,“A Decoder for Syntax-Based Statistical MT(用于基于语法的统计MT 的解码器)”,Proc.of the Conference of the Association for Computational Linguistics(ACL),2002;或者[Graehl 2004]Jonathan Graehl和Kevin Knight,“Training Tree Transducers(训练树变换 器)”,Proceedings of the 2004 Meeting of the North American chapter of the Association for Computational Linguistics(NAACL-04),2004。 这些系统在源语言或目标语言侧进行解析,并基于解析树来翻译句子。 但是,这些系统仅根据遵守语法解析的节点单元来运行翻译处理,并 且它们并不研究不是语法结构的短语组合问题。而且,这些系统没有 展现用于短语组合概率的特殊模型。

美国专利6996518公开了用于自动衡量机器翻译质量的方法。该 方法使用从源语言翻译到目标语言再翻译到源语言的“来回”翻译处 理,以识别整个翻译结果的质量。如果所得的源语言文本中的“来回” 翻译结果并不合理地等同于原始的源语言文本,则该翻译被识别为低 质量。该“来回”翻译重复多次(其中每次重复具有解码处理),直 到所得的源语言文本合理地等同于原始的源语言文本、或者直到所述 处理重复预定次数,这导致大量的计算量并且是耗时的。该方法也没 有考虑短语组合问题。

发明内容

可以看出,没有一种现有技术系统考虑了短语组合问题,短语组 合没有被明确地建模,不同的短语组合被假定为相同的短语组合概率 或者根本就不被考虑。这是不合理的,因为不同的短语组合具有不同 的短语组合概率。

而且,一旦现有技术系统的翻译模型被训练,该翻译模型就保持 静止。这些系统中的许多系统是开环的,如何评估输出中的短语翻译 的质量以及如何使用该评估来指导下一次翻译处理仍然是个问题。

鉴于以上问题,需要一种新颖的用于将文本从第一语言(即,源 语言)翻译到第二语言(即,目标语言)的系统和方法。

根据本发明的一方面,一种机器翻译方法包括以下步骤:

接收第一语言的文本;

创建反映第一语言的文本中的每个短语组合的短语组合概率的短 语组合模型;

通过使用短语组合模型、翻译模型和语言模型将第一语言的文本 翻译为第二语言的文本;

将第二语言的文本作为翻译结果输出,其中,所述翻译结果包含 被翻译短语。

另外,本发明的机器翻译方法还包括以下步骤:基于翻译结果中 的被翻译短语来评估翻译结果的翻译质量;调整翻译模型中与被翻译 短语对应的翻译候选的翻译概率以用于下一次翻译处理。

根据本发明的另一方面,一种机器翻译系统包括:

输入单元,被配置为接收第一语言的文本;

创建单元,被配置为创建反映第一语言的文本中的每个短语组合 的短语组合概率的短语组合模型;

翻译单元,被配置为通过使用短语组合模型、翻译模型和语言模 型将第一语言的文本翻译为第二语言的文本;

输出单元,被配置为将第二语言的文本作为翻译结果输出,其中, 所述翻译结果包含被翻译短语。

另外,本发明的机器翻译系统还包括:评估单元,被配置为基于 翻译结果中的被翻译短语来评估翻译结果的翻译质量;调整单元,被 配置为调整翻译模型中与被翻译短语对应的翻译候选的翻译概率以用 于下一次翻译处理。

根据本发明的另一方面,一种用于将第一语言的文本翻译为第二 语言的文本的机器翻译系统中的解码器设备,其中,机器翻译系统包 括输入单元和输出单元,输入单元被配置为接收第一语言的文本,输 出单元被配置为输出被翻译为第二语言的文本,解码器设备包括:

创建单元,被配置为创建反映第一语言的文本中的每个短语组合 的短语组合概率的短语组合模型;

翻译单元,被配置为通过使用短语组合模型、翻译模型和语言模 型将第一语言的文本翻译为第二语言的文本。

根据本发明,短语组合模型被提出,以反映不同短语组合(其中 每个短语组合被作为一个单位进行翻译),并反映短语组合是否符合 语法结构。通过本发明,能够在翻译期间考虑短语组合,这导致更精 确的翻译。

另外,还能够评估输出中的短语翻译的质量,并调整与短语对应 的翻译候选的翻译概率以更新翻译模型而不是存储低质量翻译候选, 这使得能够用当前翻译的结果来指导下一次翻译,并且系统变为闭环 反馈系统。

从以下参照附图的描述,本发明的其他特有特征和优点将会清楚。

附图说明

合并在本说明书中并构成本说明书的一部分的附图图示了本发明 的实施例,并与描述一起用于解释本发明的原理。

图1A图示了示出常规的机器翻译系统1000的结构的框图。

图1B图示了示出根据本发明的实施例的解码器单元200’的结构 的框图。

图1C示出了根据本发明的实施例的机器翻译系统1000’。

图2图示了示出可实现本发明的实施例的计算机系统2000的硬件 配置的框图。

图3图示了用于实现本发明的实施例的方法的流程图。

图4图示了根据本发明的实施例的用于创建短语组合模型的流程 图。

图5图示了由解码器单元200’执行的操作的流程图。

图6图示了图4的步骤S230中的操作的流程图。

图7图示了根据本发明的实施例的翻译方法的流程图。

图8图示了图7的步骤S500的操作的流程图。

具体实施方式

在开始详细描述本发明之前,为了易于理解,下面介绍本文所使 用的一些术语的含义。

短语(phrase):文本中的可能不具有语法或语义含义的相邻单 词,单个单词也可被视为短语。

短语组合模型(phrase combination model):该模型反映将文本 中的一些短语进行组合以将这些短语作为整体翻译的概率。

短语组合概率(phrase combination probability):用于将文本中 的一些短语进行组合以将这些短语作为整体翻译的概率。

翻译模型(translation model):该模型反映关于源-目标短语翻 译的一些信息。它存储源语言短语、对应的目标语言翻译候选以及翻 译概率。

语言模型(language model):该模型是单语的,并用于优化翻 译,以使得翻译可以通顺和相关。

翻译候选(translation candidate):对于每一个源语言短语,可 能存在针对它的许多目标语言翻译,每一个目标语言翻译项是一个翻 译候选。

原始短语组合(original phrase combination)和子短语组合 (sub-phrase combination):当一些短语被组合为将被翻译的实体C 时,如果可在翻译模型中找到C,也就是说,它在翻译模型中具有对 应的翻译候选,则该短语组合是原始短语组合。如果C在翻译模型中 不具有翻译候选,则将只有通过组合两个小的短语来得到它,该短语 组合被称为子短语组合。

语法短语组合处理(syntax phrase combination process):这是 根据短语组合是否符合语法结构来对待该短语组合的处理。

语法短语标签(syntax phrase tag):用于短语的根据该短语是否 符合语法的标签,例如,动词短语被记为“VP”。

分隔点(partition point):单词的位置,在该位置上短语被划分 为左部分和右部分。

术语短语组合处理(term phrase combination process):这是根 据短语组合是否包括术语来对待该短语组合的处理。

可能情况(hypothesis):可能情况是具有关于翻译的一些信息的 翻译状态,所述信息诸如:

1)与已被翻译的对应源单词有关的信息;

2)与目标语言的对应翻译候选有关的信息;

3)与短语组合模型的短语组合概率有关的信息;

4)与翻译模型的翻译概率有关的信息;

5)与语言模型的语言概率有关的信息;

6)与其它模型的概率有关的信息;和

7)与总概率有关的信息。

接下来,将参照附图来详细描述本发明的实施例。请注意,类似 的附图标记和文字表示图中类似的项目,因此,一旦在一个图中定义 了某项目,对于后面的图就无需对其进行讨论。

虽然将以英文作为第一语言、中文作为第二语言来描述本发明的 特定实施例,但是这些仅仅是作为例子,本发明不限于此。从以下描 述可容易认识到,用作源语言或目标语言的语言不影响本发明的实现, 只要在源语言中可产生短语组合即可。

图1A图示了示出常规的机器翻译系统100的结构的框图。

机器翻译系统1000包括输入单元100、解码器单元200、输出单 元300以及翻译模型420和语言模型430。

输入单元100用作用户输入第一语言(比如,英文)的文本以由 机器翻译系统1000翻译为第二语言(比如,中文)的文本的输入部件。 输入部件可包括但不限于可用于输入用于翻译的文本的键盘、触摸面 板、记录笔、麦克风、用户界面等。

解码器单元200用于将文本从第一语言翻译为第二语言以获得翻 译输出。为了实现翻译,解码器单元200将直接或者经由数据访问单 元(未示出)访问翻译模型420和语言模型430。

输出单元300用作用于将翻译结果输出给用户的输出部件。输出 部件可包括但不限于可用于将翻译结果输出给用户的显示面板、扬声 器、用户界面等。

常规的机器翻译系统1000在其翻译期间没有考虑短语组合模型, 不同的短语组合被假定为相同的短语组合概率或者根本就不被考虑。 这是不合理的并会导致质量不好的翻译,因为不同的组合具有不同的 短语组合概率。

为此,图1B图示了示出根据本发明的实施例的可用于创建短语 组合模型的解码器单元200’的结构的框图。

如图1B所示,解码器单元200’包括创建单元210和翻译单元220。 创建单元210用于创建捕捉不同短语组合中的不同短语组合概率的短 语组合模型410。翻译单元220用于参照所创建的短语组合模型410、 翻译模型420和语言模型430将文本从第一语言翻译为第二语言。

另外,在常规的机器翻译系统1000中,来自解码器单元200的翻 译输出仅被传送给用户而不作用于下一次翻译,致使常规的机器翻译 系统1000成为开环系统,并使得翻译模型420固定而不改变。

为此,图1C示出了根据本发明的实施例的机器翻译系统1000’, 除了图1A和图1B中所示的组件(例如,输出单元300、短语组合模 型410和语言模型430,出于简洁性原因而将其省略)之外,机器翻 译系统1000’还具有评估单元500、调整单元600和更新单元700。

评估单元500用于评估由解码器单元200’输出的翻译的翻译质 量。

调整单元600用于基于评估单元500的评估结果来调整翻译概率。

更新单元700用于改进或更新翻译模型420,更新后的翻译模型 420用于下一次翻译处理。改进或更新翻译模型可包括用新调整的翻 译模型代替对应的旧翻译模型、或者将调整后的翻译概率与原始翻译 概率组合以得到新的模型。用于改进或更新翻译模型的具体技术在相 关领域中是已知的,将省略其详细描述。

通过使用本发明的实施例的机器翻译系统1000’,不仅可在翻译 处理期间考虑短语组合概率,而且可更新翻译模型420,并且,机器 翻译系统变为闭环反馈系统,使得翻译效率以及翻译质量可得以改进。

在下文中将详细描述解码器单元200’(包括创建单元210和翻译 单元220)和评估单元500的详细操作。

根据本发明的可替代实施例,机器翻译系统1000’还可包括耦接 在输入单元100与解码器单元200’之间的预处理单元(未示出),该 预处理单元用于对输入文本进行预处理,作为解码器单元200’对后续 翻译的准备处理。所述准备处理可包括但不限于分割输入文本中的单 词、根据标点符号将输入文本分割为分开的句子、以及使输入文本的 编码(例如,十进制到二进制转换器(Decimal to Binary Converter, DBC)情况和六十进制到二进制转换器(Sexagesimal to Binary Converter,SBC)情况的转换、标点符号编码等)一致。

根据本发明的另一可替代实施例,机器翻译系统1000’还可包括 耦接在输入单元100与解码器单元200’之间的术语识别单元(未示 出),该术语识别单元用于识别输入文本中的术语。术语是在上下文 中重要且相对稳定的构造,并通常被翻译为其它语言中的稳定形式。 机器翻译系统1000’可具有术语存储器,每次文本被输入时,将搜索 术语存储器来查找在输入文本中是否存在术语。如果在输入文本中存 在术语,则将在文本中标记术语的位置。一些术语例子如下:Dialog Box(对话框)、Print head(打印头)、PC Printing Guide(PC打 印向导)、Control Panel(控制面板)、Hard disk(硬盘)或ALARM Lamp(警告灯)。用于标记文本中的术语的技术在相关技术中是已知 的,为了说明书的简洁,将省略其详细描述。如果在实际翻译之前进 行术语识别,则可减小翻译处理中的计算量和翻译结果的偏差,这导 致更高效率且更精确的翻译。

根据本发明的另一可替代实施例,机器翻译系统1000’可包括预 处理单元和术语识别单元这二者,这两个单元按指定的顺序耦接在输 入单元100与解码器单元200’之间。

本领域技术人员可容易意识到,在上面描述的单元和将在下面描 述的单元是用于实现将在下面描述的处理的示例性和/或优选模块。所 述模块可以是硬件单元(例如,现场可编程门阵列、数字信号处理器、 专用集成电路等)和/或软件模块(例如,计算机可读程序)。以上没 有穷尽描述用于实现各个步骤的模块。然而,在存在执行某一处理的 步骤的情况下,可以存在用于实现相同处理的对应功能模块或单元(用 硬件和/或软件实现)。由以下描述的步骤的所有组合和与这些步骤对 应的单元限定的技术方案被包括在本申请的公开内容中,只要它们所 构成的技术方案是完整且可应用的。

此外,由各种单元构成的上述装置可作为功能模块被合并到诸如 计算机的硬件设备中。当然,除了这些功能模块之外,计算机还可具 有其它硬件或软件组件。

图2图示了示出可实现本发明的实施例的计算机系统2000的硬件 配置的框图。

如图2所示,计算机系统包括计算机1110。计算机1110包括经 由系统总线1121连接的处理单元1120、系统存储器1130、非可移除 非易失性存储器接口1140、可移除非易失性存储器接口1150、用户输 入接口1160、网络接口1170、视频接口1190和输出外设接口1195。

系统存储器1130包括ROM(只读存储器)1131和RAM(随机 存取存储器)1132。BIOS(基本输入输出系统)1133驻留在ROM 1131 中。操作系统1134、应用程序1135、其它程序模块1136和一些程序 数据1137驻留在RAM 1132中。

非可移除非易失性存储器1141(例如硬盘)与非可移除非易失性 存储器接口1140连接。非可移除非易失性存储器1141可存储例如操 作系统1144、应用程序1145、其它程序模块1146和一些程序数据 1147。

可移除非易失性存储器(例如软盘驱动器1151和CD-ROM驱动 器1155)与可移除非易失性存储器接口1150连接。例如,软盘1152 可被插入到软盘驱动器1151中,CD(紧致盘)1156可被插入到 CD-ROM驱动器1155中。

输入设备(例如麦克风1161和键盘1162)与用户输入接口1160 连接。

计算机1110可通过网络接口1170与远程计算机1180连接。例如, 网络接口1170可经由局域网1171与远程计算机1180连接。可替代地, 网络接口1170可与调制解调器(调制器-解调器)1172连接,并且调 制解调器1172经由广域网1173与远程计算机1180连接。

远程计算机1180可包括存储远程应用程序1185的存储器1181 (例如硬盘)。

视频接口1190与监视器1191连接。

输出外设接口1195与打印机1196和扬声器1197连接。

图2所示的计算机系统仅仅是说明性的,绝非意图限制本发明、 其应用或用途。

图2所示的计算机系统对于任一实施例可被实现为独立计算机或 者被实现为装置中的处理系统,其中可能移除一个或多个不必要的组 件或者添加一个或多个附加的组件。

图3图示了用于实现本发明的实施例的方法的流程图。

在步骤S100中,经由输入单元100输入第一语言(比如,英文) 的文本。可一次将一个或多个文本输入到机器翻译系统中。在存在多 于一个文本的情况下,将以一次一个的方式对它们进行翻译。

接着,在步骤S200中,由创建单元210创建短语组合模型,以反 映输入文本中的短语组合的短语组合概率。

然后,在步骤S300中,由翻译单元220参照翻译模型、短语组合 模型、语言模型和其它可能的模型(比如,重排序模型)将第一语言 (比如,英文)的文本翻译为第二语言(比如,中文)的文本。

最后,在步骤S400中,由输出单元300输出翻译结果。

根据本发明的可替代实施例,在第一语言的文本被输入之后,可 首先对它进行预处理(例如,分割输入文本中的单词、根据标点符号 将输入文本分割为分开的句子、以及使输入文本的编码一致),作为 对于后续处理的准备处理。

根据本发明的另一可替代实施例,在第一语言的文本被输入之后, 还可存在用于识别输入文本中的术语的步骤,以减小翻译处理中的计 算量和后续处理中的翻译结果的偏差。

根据本发明的另一可替代实施例,可按指定的顺序执行上述预处 理步骤和术语识别步骤这二者。

图4图示了由本发明的实施例的创建单元210创建短语组合模型 的流程图。

假定在图3的步骤S100中具有K个单词的第一语言的文本被输 入到输入单元100,并且取“clean the inside of the printer”作为输入 文本的具体例子,其中,K为6。

输入文本可被划分为不同范围(或长度)值的子文本。例如,每 个单词本身是范围值(range value)R_N=1的子文本,“clean the”、 “the inside”、“inside of”、“of the”和“the printer”是范围值 R_N=2的子文本。

在步骤S210中,从最小范围(R_N=1)开始,枚举子文本中的可 能情况。

可能情况可通过范围值以及输入文本中的起始单词位置和结束单 词位置来定义,并以hypothesisstack[nLeft][nRight]的堆栈形式被存 储,其中,[nLeft]表示可能情况的左位置或起始位置,[nRight]表示 可能情况的右位置或结束位置。

例如,对于输入文本“clean the inside of the printer”,其中的 单词位置是:

clean[0]the[1]inside[2]of[3]the[4]printer[5]

于是,覆盖“clean the inside”的翻译可能情况可被存储为 hypothesisstack[0][2]。

然而,本领域技术人员容易意识到,当本发明用于从右到左阅读 的语言时,可能情况的右位置将是起始位置,可能情况的左位置将是 结束位置。

以下,将通过使用从左到右阅读的语言作为例子来描述本发明。

接着,在步骤S220中,在对输入文本的当前范围枚举所有可能情 况之后,对每个枚举的可能情况产生短语组合,如将在下面更详细描 述的。

然后,在步骤S230中,对每个短语组合计算短语组合概率,如将 在下面更详细描述的。

对输入文本中的单词的每个范围执行步骤S210-230中的操作,以 创建短语组合模型。

图4的步骤S210、S220和S230可分别由未在本文示出的枚举单 元、产生单元和计算单元执行。

图5图示了由解码器单元200’执行的操作的流程图,其中,步骤 S230’-S250’与图4中的步骤S210-S230相同,为了简洁起见,将省略 其描述。

在步骤S210’中,将第一语言的输入文本划分为不同范围值的子 文本。

然后,在步骤S220’中,将范围值(R_N)初始化为1,并如参照 图4所述的那样创建该范围的短语组合模型。

在对当前范围中的所有可能情况创建短语组合模型之后,在步骤 S260’中,组合所使用的所有模型(短语组合模型、翻译模型、语言模 型等)来驱动翻译处理以得到翻译结果,稍后将详细描述步骤S260’ 的具体操作。

接着,在步骤S270’中,确定当前可能情况是否是范围(R_N) 中的最后一个。如果是,则所述操作前进到步骤S280’,在步骤S280’ 中将范围值R_N加1。否则,所述操作循环回到步骤S230’,并重复 步骤S230’-S260’的操作。

在步骤S280’中将范围值R_N加1之后,在步骤S290’中确定范 围值R_N是否大于K。如果是,则可输出对于当前输入文本(即, hypothesisstack[0][K-1])以目标语言的翻译结果。否则,所述操作循 环回到步骤S230’,并重复步骤S230’-S280’的操作。

本发明的实施例的解码器单元200’应用自下而上的动态编程机 制。也就是说,解码器单元200’首先对输入文本中的小范围的源单词 运行翻译处理,将对应的翻译可能情况存储在对应的堆栈中。然后, 解码器单元200’扩展可能情况以覆盖更大的范围,直到整个输入文本 被翻译。

为了创建短语组合模型,在每一个单词范围中,解码器单元200’ 的创建单元210枚举具有该范围值的所有可能情况。对于具有索引 hypothesisstack[nLeft][nRight]的每一个可能情况堆栈,创建单元210 将运行用于产生所有短语组合的短语组合处理(其中每一个短语组合 是对应的翻译可能情况)以及用于对每一个可能情况计算短语组合概 率的处理,解码器单元200’的翻译单元220运行用于组合所有所使用 的模型来产生每一个可能情况的最终翻译状态并得到可能情况堆栈的 最终可能情况(或翻译结果)的处理。范围扩大,直到产生范围 (R_N=K)中的所有可能情况,并输出翻译结果。

以下,将更详细地描述在图4的步骤S220中或者在图5的步骤 S240’中对于某一范围的可能情况产生所有短语组合的操作。

对于从左位置到右位置覆盖输入文本的当前范围的源单词的翻译 可能情况堆栈,所述方法可具有两种形式来产生短语组合。

第一种形式是将该范围内的所有相邻单词组合为可能情况的整个 短语,该形式通常对于在翻译模型中具有对应翻译项或候选的源单词 进行。

然而,对于在翻译模型中不具有对应翻译项或候选的源单词,第 二种形式是可在中间点(middle point)(即,分隔点(partition point)) 上将其当前范围分割为左短语组合和右短语组合,然后将这两个部分 组合以生成可能情况的短语组合。

例如,对于输入文本“clean the inside of the printer”,可生成 以下短语组合:

输入文本:clean[0]the[1]inside[2]of[3]the[4]printer[5] PhraseCom:([0][0])([1][1])([2][2])......  ......   ......

([0][1])([2][3])......

([1][2])......

([0][2])......     ......

PhraseCom[0][2]可通过将相邻单词“clean the inside”组合为一 个短语而生成(上述第一种形式)。

可替代地,PhraseCom[0][2]可通过将具有覆盖源单词“clean the” 的可能情况的PhraseCom[0][1]与具有覆盖源单词“inside”的可能情 况的PhraseCom[2][2]合并来生成,或者通过将PhraseCom[0][0]和 PhraseCom[1][2]合并来生成,其中分割点在不同的位置(上述第二 种形式)。因为PhraseCom[0][1]、PhraseCom[2][2]、PhraseCom[0][0] 和PhraseCom[1][2]的范围值小于PhraseCom[0][2]的范围值,所以它 们在之前已被翻译。

可以看出,对于第二种形式,首先,从左到右枚举 hyphothesisstack[nLeft][nRight]的当前范围中的分隔点;其次,通过 在左侧的第一分隔点上分隔当前范围获得的左短语组合和右短语组合 被合并以生成当前可能情况的短语组合;然后,通过将分隔点移到下 一分隔点以处理下一短语组合来重复该处理,直到所有的分隔点被处 理。

对于所产生的每一个短语组合,将产生对于 hypothesisstack[nLeft][nRight]的可能情况。可考虑第一种形式和第二 种形式这两种形式的短语组合。

接下来,将参照图6来更详细地描述在图4的步骤S230中或者在 图5的步骤S250’中对于与短语组合对应的可能情况计算短语组合概 率的操作。

如图6所示,对于从图4的步骤S220(或者图5的步骤S240’) 产生的每个短语组合C(比如,具有R个单词),在步骤S231中, 确定当前短语组合C是否是原始短语组合。

如上所述,具有某一范围的相邻单词的短语可被看作大的短语 (即,上述第一种形式),或者可由两个小的子短语生成(即,上述 第二种形式)。如果可在翻译模型中找到当前短语组合C,也就是说, 它具有对应的翻译项或候选,则该短语组合被称为原始短语组合。在 这种情况下,当前短语组合C中的子短语的数量为1,所述方法设置:

Ncom(C)=Ncom_o(C)=1    (1)

其中,Ncom是将用于计算短语组合概率的折算值(discounting value),Ncom_o是当前短语组合中的短语的原始数量。

如果当前短语组合C在翻译模型中不具有翻译项或候选,则将只 有通过组合两个小的子短语来得到它,该短语组合被称为子短语组合。

如果在步骤S231中确定当前短语组合C是原始短语组合,则在 步骤S232至S236中对它进行原始短语组合处理。否则,它将在步骤 S237和S238中经过子短语组合处理。

原始短语组合处理可包括两个处理,即,被示为步骤S232-S233 的术语短语组合处理和被示为步骤S234-S236的语法短语组合处理。 术语短语组合处理不是本发明的必要处理,并且可被省略。另外,虽 然在下文中示出术语短语组合处理在语法短语组合处理之前执行,但 是本发明不限于此。例如,术语短语组合处理也可与语法短语组合处 理同时执行。

返回参照图6,具体地讲,如果在步骤S231中确定当前短语组合 C是原始短语组合,则在步骤S232中进一步确定它是否包含整个术语 或者术语的分解片段(broken fragment)。如前面所述的,所述方法 通过任意地组合相邻单词来生成短语组合。作为这样做的结果,当前 短语组合C可能具有术语的分解片段。例如,对于输入文本“clean the inside of the printer”,短语组合“inside of the”具有术语“the printer” 的分解片段。

然后,在步骤S233中,基于来自步骤S232的确定结果,执行术 语短语组合处理如下。

1)如果当前短语组合C具有术语的分解片段,则所述方法设置:

PCOM(f~,e~)=Min_Vaule---(2)

或者

Ncom(C)=Ncom_o(C)=Max_Vaule    (3)

其中,PCOM是所述短语组合概率,和是对应的第一语言和第二 语言短语组合并且表示第一语言中的当前短语组合C,Min_Vaule和 Max_Vaule是可通过机器翻译系统的实际翻译概率而确定的最小值和最 大值。

可以看出,所述方法通过将短语组合概率设置为最小值来给予这 种情况重罚,表明该短语组合差。

2)如果当前短语组合C具有术语,则所述方法设置:

Ncom(C)=Ncom_o(C)λt---(4)

其中,λt是术语的加权系数,λt>1,比如,λt=1.5。

3)在以上1)和2)的操作之后,或者如果当前短语组合C不具有 一个术语或多个术语的分解片段,则所述方法前进到步骤S234中的语 法短语组合处理。

在步骤S234中,确定当前短语组合C是否是语法短语。也就是 说,所述方法根据短语是否符合源语言中的语法结构来对所述短语组 合进行处理。

在计算机辅助翻译中,由于精确度原因,可能语法结构的翻译比 整个句子的翻译更重要,所述方法可增强具有语法结构的所述短语组 合。该步骤的细节如下所示。

如所知道的,可存在将语法知识应用于翻译的不同方式。根据本 发明的实施例,提出将语法知识应用于翻译的两种定制方式。一种方 式是在训练翻译模型的处理中,标注用于源语言训练语料库的POS (part-of-speech,词性),以使翻译模型中的翻译项或候选具有语法 知识。另一种方式是标注POS或者对输入文本进行浅层解析。所述方 法使用语法短语解析器来确定短语组合是否符合语法结构。该解析器 实现基于一些语法规则(例如一些名词短语规则、动词短语规则等) 的处理,一些规则如下:

AT0+ADJ+NN→NP

AJ0|ORD|VVG→ADJ

PRP+NP→PP

PRP+NN→PP

VVB+NP→VP

其中,AT0表示冠词,NN表示名词,ADJ表示形容词,AJ0、 ORD(序数)和VVG均可表示形容词,VVG表示动词现在分词, PRP表示介词,VVB表示动词,NP、PP和VP分别表示名词短语、 介词短语和动词短语。所述方法主要对NP、PP和VP以及它们的组 合进行解析。

如果步骤S234中的确定是肯定的,也就是说,当前短语组合C 是语法短语,则所述方法前进到步骤S235,在步骤S235中执行以下 操作。

1)对于短语组合使用以下公式:

Ncom(C)=Ncom(C)λp---(5)

其中,1<λpt,比如,λp=1.2,λt是术语的加权系数,λp是语法 短语的加权系数。

2)通过使用以下公式来计算对应可能情况的短语组合概率:

PCOM(f~,e~)=1Ncom(C)---(6)

其中,PCOM是所述短语组合概率,和是对应的第一语言和第二 语言短语组合,是指第一语言中的当前短语组合C。

如果当前短语组合C不是语法短语,则在步骤S236中也通过公 式(6)计算其对应可能情况的短语组合概率。

在图5的步骤S260’中可使用这样计算的短语组合概率,用于驱 动翻译处理并得到翻译结果。

如果在步骤S231中确定当前短语组合C不是原始短语组合,则 所述方法前进到步骤S237,以确定当前短语组合C是否可以被子组合 (即,子短语组合)。

另外,即使当前短语组合C已经过了原始短语组合处理,取决于 额外的子组合是否将导致比在原始短语组合处理中计算的短语组合概 率更好的短语组合概率,它仍可进一步经过子短语组合处理,这在图 6中用虚线箭头所示。例如,可以基于经验来预先设置阈值,如果在 原始短语组合处理中计算的短语组合概率大于该预先设置的阈值,则 可省略额外的子组合处理,否则,可执行额外的子组合处理。

在步骤S237中,确定当前短语组合C是否可以被子组合。

如果是,则所述方法通过组合当前短语组合C的左子短语和右子 短语来对可能情况的当前短语组合C进行子短语组合处理,并如下得 到在步骤S238中计算的短语组合概率。

1)得到当前短语组合C的左短语组合和右短语组合。这里,如 早前参照图4的步骤S220或者在图5的步骤S240’中所述,可通过使 用用于针对某一范围的可能情况产生短语组合的第二种形式来获得当 前短语组合C的左短语组合和右短语组合。

2)如下对左可能情况的短语组合进行处理:

如果存在与左短语组合对应的可能情况,则设置:

Ncom_o(C_Left)=Ncom_o(Left)    (7)

这里,Ncom_o(C_Left)是左可能情况的短语组合的组合值 (combination value),即,左可能情况中的子短语的数量,Ncom_o(Left) 是左可能情况中的子短语的单词的数量。

如果不存在与左短语组合对应的可能情况,则这意味着对于左短 语不存在翻译,然后设置:

Ncom_o(C_Left)=λo(nMid-nLeft+1)    (8)

其中,nMid表示当前短语组合C中的分隔点的单词位置,nLeft是 当前短语组合C的左界限(bound)单词位置,λo>1,(比如,λo=2), 在这种情况下,子短语的数量大于左短语组合中的单词的数量。

3)对右可能情况的短语组合进行与左可能情况的处理相同的处 理。所述方法设置Ncom_o(C_Right),其中,Ncom_o(C_Right)是右可能情况 的短语组合的组合值,即,右可能情况中的子短语的数量。

4)得到该短语组合C中的子短语的原始数量:

Ncom_o(C)=Ncom_o(Left)+Ncom_o(Right)    (9)

其中,Ncom_o(Right)是右可能情况中的子短语的单词的数量。

5)由短语解析器从左标签和右标签推导最终的语法短语标签。如 果语法短语标签不能从短语解析器推导,则所述方法组合左标签和右 标签作为结果。

如果最终的语法短语标签符合语法结构,或者,如果左可能情况 和右可能情况都符合语法结构,则设置:

Ncom(C)=Ncom_o(C)λp---(10)

否则:

Ncom(C)=Ncom_o(C)    (11)

6)如以下公式计算该短语组合C的短语组合概率:

PCOM(f~,e~)=1Ncom(C)---(12)

从步骤S230的上述描述可以看出,对于当前短语组合,术语短语 组合处理和语法短语组合处理将源相邻单词视为整个短语,如前面的 第一形式所定义的。如果短语组合满足这些处理的一个或多个限制, 则该短语组合将在对应的步骤中被处理,并得到对应可能情况的短语 组合概率。

无论短语组合是否满足术语短语组合处理和语法短语组合处理的 限制,都可在子短语组合处理中通过将短语组合划分为两个短语组合 来对短语组合进行处理,每一个短语组合将被计算出对应可能情况的 短语组合概率。如果当前短语组合不能满足术语短语组合处理、语法 短语组合处理和子短语组合处理中的任一限制,则所述方法将例如通 过将该短语组合的翻译概率设置为0或者通过将该短语组合的源文本 设置为该短语组合的翻译结果来前进到对该当前短语组合的缺省处 理。

步骤S231的操作可由判断单元执行,原始短语组合处理可由原始 短语组合单元执行,所述原始短语组合单元还可包括用于执行术语短 语组合处理的术语短语组合单元和用于执行语法短语组合处理的语法 短语组合单元,以及子短语组合处理可由子短语组合单元执行,这些 单元在本文中未示出。

接下来,将更详细地描述图5的步骤S260’的操作。

在该步骤中,翻译单元220组合所使用的所有模型来计算每一个 可能情况的总概率(也即,总累积统计概率)并得到翻译结果。诸如 短语组合模型、翻译模型、语言模型和其它模型(比如,重排序模型) 这样的模型按线性对数的形式进行组合:

Ptotal(f~,e~)=λcomlogPcom(f~,e~)+λtranslogPtrans(f~,e~)+λlmlogPlm(f~,e~)+λotherlogPother(f~,e~)---(13)

其中,Ptotal是当前可能情况的总概率,Pcom是短语组合概率,Ptrans是 翻译概率,是语言概率,Pother是其它模型的概率,λcom、λtrans、λlm和λother分别是对应模型的系数,这些系数中的每一个可通过其训练或 者从经验值确定。如果不使用其它模型,则可从公式(13)省略 部分。

可存在用于确定当前短语组合的翻译结果的不同标准:

1)所述方法可以以最高的总概率Sf确定翻译结果:

Sf=max{Ptotal(f~,e~)ofthehypothesis}---(14)

该选择对于当前短语组合选择具有最高总概率的可能情况。

2)所述方法还可选择具有根据语法的短语组合和最高总概率的 可能情况作为当前短语组合的最终翻译结果。

该选择是一种严格的选择,可能所述方法得不到输入文本的整个 翻译,但是可得到具有相对良好的语法的部分翻译。

所述方法还可设置用于选择用于输出给用户的翻译结果的其它标 准。

根据本发明的实施例,在获得翻译结果之后,可存在可对翻译结 果进行评估的优化处理,并且可调整翻译概率以更新翻译模型。

图7图示了根据本发明的实施例的翻译方法的流程图。步骤 S100-S400与图3所示的那些步骤相同,为了描述的简洁性,将省略 其描述。

如图7所示,在步骤S400中输出翻译结果之后,在步骤S500中 评估翻译结果的质量。

接着,在步骤S600中,基于翻译结果的评估来调整现有的翻译概 率。

在这之后,在步骤S700中,基于调整后的翻译概率来更新翻译模 型。

然后,在步骤S800中,确定所有的文本是否已被翻译,如果是, 则所述方法前进到结束,否则,它循环回到步骤S100,并重复步骤 S100-S700中的操作。

可以看出,通过本发明的实施例,机器翻译系统变为闭环翻译系 统,这可导致高效率的翻译。

接着,将参照图8来描述图7的步骤S500的操作。

首先,在步骤S510中,所述方法将根据翻译结果确定质量阈值pT。

在该步骤中,翻译结果由作为对应的第一语言短语的翻译候选的 许多第二语言短语组成。翻译结果中的每个被翻译短语通过翻译处理 被计算了总累积统计概率,该步骤将基于这些概率计算pT如下:

a)对于与第一语言短语对应的每一个被翻译短语得到所述总累 积统计概率。

b)根据以下公式计算质量阈值pT

pT=p1,p2......pnTNT---(15)

这里,pT是质量阈值,NT是与输入文本中的第一语言短语对应的 被翻译短语的数量,是被翻译短语的总累积统计概率Ptotal

接着,在步骤S520中,所述方法将如下通过比较被翻译短语的总 累积统计概率与质量阈值来评估与翻译结果中的每个被翻译短语有关 的翻译质量:

a)在被翻译短语的总累积统计概率大于或等于质量阈值pT的 情况下,将与翻译结果中的被翻译短语对应的翻译候选评估为良好质 量。

b)在总累积统计概率小于质量阈值pT的情况下,将与翻译结 果中的被翻译短语对应的翻译候选评估为非良好质量。

在翻译质量被评估之后,可如下实现步骤S600中的基于所述良好 质量的翻译候选来调整现有的翻译概率的操作:

a)对于翻译结果中具有所述良好质量的翻译候选的每个被翻译 短语,得到输入文本中的对应的第一语言短语。

b)调整通过a)得到的输入本文中的第一语言短语的翻译候选的 翻译概率。在翻译模型中可存在与第一语言短语对应的许多翻译候选。

对于翻译结果中具有所述良好质量的翻译候选的每个被翻译短 语,根据以下公式来调整翻译候选的翻译概率:

pg_o=pg_i+Σpb_iN---(16)

其中,pg_i是翻译模型中的所述良好质量的翻译候选的初始翻译 概率,pg_o是调整之后的翻译概率,pb_i是其它翻译候选的原始翻译概 率,所述其他翻译候选不是所述良好质量的翻译候选,N是第一语言 短语所具有的翻译候选的数量。

对于不是所述良好质量的翻译候选的其它翻译候选中的每一个, 根据以下公式来调整翻译概率:

pb_o=N-1Npb_i---(17)

这里,pb_i是其它翻译候选的原始翻译概率,所述其他翻译候选不 是所述良好质量的翻译候选,pb_o是调整之后的翻译概率。N是第一语 言短语所具有的翻译候选的数量。

通过使用本发明的实施例,反映不同短语组合概率的短语组合模 型被用在翻译处理中,这可使得翻译更精确且更有效。另外,翻译结 果中的短语翻译质量被评估,并且对应的翻译概率被调整,这使得可 通过使用当前的翻译输出来指导下一次翻译。因此,本发明的实施例 的机器翻译系统变为闭环反馈系统,这再次改进了翻译效率和准确度。

发明人进行了与本发明的实施例的翻译系统和方法的性能有关的 一些实验,其中,大约300000个英文-中文句子对被用于训练翻译模 型,548个英文句子被选择作为测试数据,并且这些句子中的每个具 有一个翻译参考。

翻译结果被示出在以下的表1中。

表1

从表1可以看出,翻译结果中的短语组合很好地符合语法结构。 例如,在解码中,名词短语“the results of automatic print head alignment”和动词短语“clean the inside of the printer again”被组合 翻译。

发明人使用通过将翻译结果与参考翻译进行比较而计算的BLEU 得分来测试本发明的实施例的翻译方法,BLEU得分被示出在以下的 表2中。

在表2中,“无Com-model”是指在不使用由本发明的实施例提 出的所述短语组合模型的情况下翻译源句子,“Com-model+TP”表 示使用仅具有术语短语组合处理的所述短语组合模型, “Com-model+TP+SP”表示使用具有术语短语组合处理和语法短语组 合处理的所述短语组合模型。

表2

从表2可以看出,对于n元文法(n-gram)BLEU得分,在不使 用短语组合模型的情况下得分最低,当使用具有术语短语组合处理的 短语组合模型时,BLEU得分从大约0.388增大到0.487,并且当使用 具有所述术语短语组合处理和所述语法短语组合处理的所述短语组合 模型时,BLEU得分达到最高值0.50157。在每个元文法得分中,在使 用短语组合模型的情况下值增大,所有这些表明本发明的实施例的有 益效果。

虽然已用例子详细展示了本发明的一些特定实施例,但是本领域 技术人员应该理解,以上例子仅意在说明,而非限制本发明的范围。

可以以许多方式来实现本发明的方法和装置。例如,可通过软件、 硬件、固件或者它们的任意组合来实施本发明的方法和装置。方法的 步骤的上述顺序仅意在说明,并且本发明的方法的步骤不限于以上具 体描述的顺序,除非另有特别说明。此外,在一些实施例中,本发明 还可被实现为记录在记录介质中的程序,包括用于实现根据本发明的 实施例的方法的机器可读指令。因此,本发明还覆盖存储用于实现根 据本发明的实施例的方法的程序的记录介质。

本领域技术人员应该理解,在不脱离本发明的范围和精神的情况 下,可对以上实施例进行修改。本发明的范围由所附权利要求限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号