首页> 中国专利> 用于提供包括上下文相关定义和示例的可视翻译卡的技术

用于提供包括上下文相关定义和示例的可视翻译卡的技术

摘要

本申请涉及用于提供包括上下文相关定义和示例的可视翻译卡的技术。计算机实现的技术能够包括接收以源语言的选择单词,获得该选择单词的一个或多个词性,并且针对该一个或多个词性中的每个,获得该选择单词的到不同目标语言的候选翻译,每个候选翻译与该选择单词的特定语义含义相对应。该技术能够包括针对该选择单词的每个语义含义:获得与该选择单词的该语义含义相对应的图像,并且编辑翻译信息,该翻译信息包括(i)语义含义、(ii)相对应的词性、(iii)图像、以及(iv)至少一个相对应的候选翻译。该技术还能够包括输出该翻译信息。

著录项

  • 公开/公告号CN112800783A

    专利类型发明专利

  • 公开/公告日2021-05-14

    原文格式PDF

  • 申请/专利权人 谷歌有限责任公司;

    申请/专利号CN202110147193.3

  • 申请日2016-05-12

  • 分类号G06F40/58(20200101);G06F40/30(20200101);

  • 代理机构11219 中原信达知识产权代理有限责任公司;

  • 代理人周亚荣;邓聪惠

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 10:58:46

说明书

分案说明

本申请属于申请日为2016年5月12日的中国发明专利申请201680019025.3的分案申请。

相关申请的交叉参考

本申请要求于2015年5月18日提交的第14/714,439号美国申请的优先权。上述申请的全部公开以引用的方式并入在本文中。

技术领域

本公开大体上涉及一种语言翻译,并且更具体地说,涉及一种用于提供包括上下文相关定义和示例的可视翻译卡的技术。

背景技术

本文中提供的背景技术描述是出于大体上呈现本公开的上下文的目的。就在此背景技术部分描述的发明人目前的工作而言,以及在提交申请时不能够作为现有技术的描述的各方面,既没有明显地也没有隐含地被承认为对抗本公开的现有技术。

当在查看应用(web浏览器、电子阅读器等)中以非优选语言阅读文档时,用户可能周期性地遇到用户不认识或不理解的个别单词。在这些情况下,用户可以在该文档中选择单词以获得以他/她的优选语言中的一个的其翻译。这通常涉及将选择单词从文档剪切并粘贴到搜索应用或语言翻译应用中。用于选择单词的任何上下文信息通常在这个过程期间丢失。因为选择单词缺乏任何上下文信息,所以用户被呈现有选择单词的多种可能的翻译,其中很多翻译可能完全不适合用于使用所述单词的特定上下文。

发明内容

提出一种计算机实现的技术。该技术能够包括:在具有一个或多个处理器的服务器处接收以源语言的选择单词;通过该服务器获得选择单词的一个或多个词性;针对该一个或多个词性中的每个,通过该服务器获得选择单词的到不同目标语言的候选翻译,每个候选翻译与选择单词的特定语义含义相对应;针对选择单词的每个语义含义:通过服务器获得与选择单词的语义含义相对应的图像,以及通过服务器编辑翻译信息,该翻译信息包括(i)语义含义、(ii)相对应的词性、(iii)图像、以及(iv)至少一个相对应的候选翻译;以及通过服务器输出该翻译信息。

还提出一种具有一个或多个处理器的计算系统。该计算系统能够被配置为执行包括以下各项的操作:接收以源语言的选择单词;获得针对选择单词的一个或多个词性;针对该一个或多个词性中的每个,获得选择单词的到不同目标语言的候选翻译,每个候选翻译与选择单词的特定语义含义相对应;针对选择单词的每个语义含义:获得与选择单词的该语义含义相对应的图像,并且编辑翻译信息,该翻译信息包括(i)语义含义、(ii)相对应词性、(iii)图像、以及(iv)至少一个相对应候选翻译;以及输出该翻译信息。

在一些实现方式中,针对选择单词的每个语义含义,获得包括选择单词的形式的以源语言的例句,其中,该翻译信息还包括该例句。在一些实现方式中,每个例句描述其相对应的图像。在一些实现方式中,选择单词是由用户从以源语言的文档选择的单个单词。在一些实现方式中,获得与选择单词相对应的图像包括利用与各种语义含义相关联的图像的机器训练数据库。

在一些实现方式中,针对选择单词的每个语义含义,生成包括翻译信息的翻译卡,其中,输出该翻译信息包括输出该翻译卡。在一些实现方式中,该选择单词是从与用户相关联的计算装置接收的,并且翻译卡的接收使计算装置显示该翻译卡中的至少一个。在一些实现方式中,翻译卡被聚组成翻译卡集合,其中,每个翻译卡集合与不同的词性相对应,并且其中,该翻译卡的接收使计算装置显示来自特定翻译卡集合的翻译卡中的至少一个。

在一些实现方式中,该翻译卡的接收使得计算装置能够(i)在特定翻译卡集合中的不同翻译卡之间转变,以及(ii)在不同翻译卡集合之间转变二者。在一些实现方式中,该翻译卡的接收使得计算装置能够(i)在特定翻译卡集合的不同翻译卡之间垂直转变,以及(ii)在不同翻译卡集合之间水平转变。

本公开的另外适用领域将会根据下文中提供的详细描述变得显而易见。应当理解的是,希望详细描述和特定示例仅用于示例目的而不希望限制本公开的范围。

附图说明

将会根据详细描述和附图更全面地理解本公开,在附图中:

图1是根据本公开的一些实现方式的包括示例服务器的计算系统的图;

图2是图1的示例服务器的功能框图;以及

图3A至图3C示出根据本公开的一些实现方式的示例动词翻译卡;

图4A至图4B示出根据本公开的一些实现方式的在计算装置上显示的示例动词翻译卡;

图5示出根据本公开的一些实现方式的示例名词翻译卡;

图6示出根据本公开的一些实现方式的在计算装置上显示的示例名词翻译卡;以及

图7是根据本公开的一些实现方式的用于提供包括上下文相关定义和示例的翻译卡的示例技术的流程图。

具体实施方式

如前所述,常规的语言翻译技术涉及用户将选择单词剪切并粘贴到搜索或翻译应用中,从而丢失针对选择单词的任何上下文信息。例如,单词“bear”在英语中具有多种含义。英语中的单词“bear”能够意旨作为名词的动物,以及能够意旨多个动词形式:携带(carry)、支撑(support)、和转弯(turn)或转向(veer)(在方向上)。因为没有上下文信息,所以这些常规技术通常根据使用频率来呈现单词“bear”的这些形式的翻译。因此,即使选择单词“bear”的上下文是“carry”,用户仍可能被提供有以“bear”的动物/名词形式的翻译开始的翻译列表。然后用户必须搜索这个所有可能的翻译并且试图辨别上下文。这个过程对于用户来说是困难且是耗时的。

因此,本发明呈现一种用于提供包括上下文相关定义和示例的可视翻译卡的技术。每个可视翻译卡可包括(i)源语言中的选择单词的语义含义;(ii)与选择单词相对应的并且使用其语义含义获得的图像;(iii)相对应的词性(part-of-speech);以及(iv)选择单词到目标语言的至少一个相对应的候选翻译。这些技术通过使用图像向用户提供快速确定选择单词的适当翻译的能力。在一些实现方式中,可视翻译卡能够包括具有选择单词的形式并且描述所显示的图像的例句,从而提供上下文相关的、更有用的信息。用户界面还能够向用户提供在用于特定词性(例如,动词)的不同可视翻译卡之间转变以及在用于不同词性的不同可视翻译卡之间转变(例如,从动词翻译卡转变为名词翻译卡)的能力。

现在参考图1,图示包括示例服务器104的计算系统100。本文中使用的术语“服务器”能够是指单个计算装置以及以并行或分布式架构操作的多个计算装置(例如,计算系统)。服务器104能够经由网络112与计算装置108通信。计算装置108的示例包括但不限于台式计算机、膝上型计算机、平板计算机、和移动电话。网络112能够包括局域网(LAN)、例如互联网的广域网(WAN)或其组合。用户116能够与计算装置108交互,以便提供用于翻译的选择单词并且以便查看用于选择单词的翻译信息。

现在参考图2,图示示例服务器104。服务器104能够包括通信装置200、处理器204、和存储器208。通信装置200能够包括被配置用于与计算装置108通信的任何合适部件(例如,收发器)。存储器208能够为被配置为在服务器104处存储信息的任何合适存储介质(闪存、硬盘等)。例如,存储器208可以存储与各种语义含义相关的图像的机器训练数据库。处理器204能够控制服务器104的操作。由处理器208执行的示例功能包括但不限于加载/执行计算装置104的操作系统、控制经由通信装置200与网络112上的其它部件(例如,计算装置108)的通信、以及控制存储器208处的读取/写入操作。本文中使用的术语“处理器”能够是指单个处理器以及以并行或分布式架构操作的多个处理器二者。处理器204还能够被配置为执行本公开的技术的至少一部分,现在更详细地论述所述技术。

在以下示例场景中,用户116已经选择在“携带”的上下文中使用的英语(源)语言中的单词“bear”,并且正在寻找选择单词到西班牙语(目标)语言的翻译。例如,用户116可能是西班牙语母语者并且不确定诸如网页的英语文档中的单词“bear”的含义。现在参考图3A至图3C,图示示例动词翻译卡300a、300b、300c(“翻译卡300”)。单个标头304指示针对翻译卡300中的每个的词性。例如,当计算装置108为具有相对大的显示器120的台式计算机、膝上型计算机、或平板计算机时,可能利用具有同时显示多个翻译卡的这个配置。

在图3A中,翻译卡300a包括(i)选择单词(“bear”)的语义含义308(“carry”),并且在一些实现方式中,包括指示发生语义含义308的频率的相对频率指示符312。翻译卡300a还能够包括使用语义含义308获得的并且与选择单词相对应的图像320a、320b(“图像320”)。如图所示,每个图像320示出服务员携带(carrying)一托盘玻璃杯。例如,这些图像320可以使用与各种语义含义相关的图像的机器训练数据库来获得。翻译卡300a还能够包括具有选择单词(“bearing”)的形式的并且描述图像320的例句316。如图所示,例句316是“他正在携带(bearing)一托盘装满的玻璃杯(he was bearing a tray of brimmingglasses)”。在一些实现方式中,翻译卡300a还能够包括用于语义含义308的同义词的列表324。如图所示,同义词的列表324包括带来(bring)、运输(transport)、移动(move)和运送(convey)。

翻译卡300a还能够包括可选图标328、332和336或者能够以其它方式与可选图标328、332和336相关联。这些可选图标328、332、336能够被用于在语义含义308的不同子含义之间循环。如图所示,单词“carry”具有三种不同子含义——携带物体、运送乘客或货物、以及显示可见标志或特征。这些子含义中的每个能够具有不同西班牙语翻译。所显示的翻译卡300a与子含义“携带物体”相关联,并且因此,突出显示可选图标328并且示出候选翻译(llevar、portar)。如果用户116要选择与不同子含义相关联的可选图标332或336中的另一个,则将改变翻译卡300a的外观。更具体地说,例句、图像、同义词的列表、和候选翻译将会改变以反映不同子含义。

在图3B中,翻译卡300b与如在344处示出的语义含义“support”相关联。图像352a、352b(“图像352”)图示人正在支撑巨石的重量。例句348包括选择单词(“bear”)的形式并且描述图像352(“他将不再能支撑(bear)巨石的重量(he could no longer bear theweight of the rock)”)。同义词的列表356包括单词承载(carry)、举起(hold up)和撑持(prop up)。突出显示的可选图标360与子含义“支撑物体”相关联,并且以西班牙语显示候选翻译“sustener”。其它可选图标364、368与子含义“承担责任(to take responsibilityfor)”和“能够接受或坚持(to be able to accept or stand up to)”相关联。

在图3C中,翻译卡300c与如在374处示出的语义含义“转弯(turn)(在一个方向上(in a direction))”相关联。图像382示出穿过树林的小路的分岔。例句378包括选择单词(“bear”)的形式并且描述图像382(“向右转弯并且跟着老路(bear right and follow theold road)”)。同义词的列表386包括单词转向(veer)、弯曲(curve)、急转(swerve)和分岔(fork)。突出显示的可选图标390与子含义“在一个方向上转弯(to turn in adirection)”相关联并且以西班牙语显示候选翻译“mentener”。其它可选图标394、398与子含义“维持(to maintain)”和“保持(to keep)”相关联。

现在参考图4A至图4B,图示单个翻译卡显示。例如,当计算装置108为具有相对小的显示器120的移动电话或平板计算机时,能够利用一次仅显示单个翻译卡的这个配置。标头400指示词性,并且用户116能够水平地滚动到不同词性(例如,从动词滚动到名词)。在图4A中,显示翻译卡300a。在图示的示例中,翻译卡300a还能够包括例句316的到西班牙语的翻译404(“

在图4B中,显示翻译卡300b。在图示的示例中,翻译卡300b还能够包括例句348的到西班牙语的翻译408(“Que ya no podía soportar el peso de la roca”),其中强调单词“bear”和“soportar”。朝向翻译卡300b的底部,用户116能够在语义含义“support”的不同子含义之间垂直滚动。

现在参考图5,图示示例名词翻译卡500。单个标头504指示用于翻译卡500的词性。如图所示,翻译卡500包括三个部分502a、502b、502c(“部分502”),每个部分502显示不同信息。例如,当计算装置108是具有相对大的显示器120的台式计算机、膝上型计算机、或平板计算机时,能够利用具有用于同时显示的单个翻译卡的多个部分的这个配置。

翻译卡500的第一部分502a包括选择单词(“bear”)的语义含义508(“熊(bear)”,动物)、包括选择单词(“bear”)的形式的例句、以及同义词的列表520(熊(bruin)、灰熊(grizzly(bear))、黑熊(black bear)、棕熊(brown bear)等)。翻译卡500的第二部分502b能够包括以西班牙语的候选翻译524(“el oso”)和相对频率指示符528。翻译卡500的第三部分502c能够包括与选择单词(“bear”)相关的最流行单词的树532。如图所示,这些相关单词包括各自是动物的种类的极地的(polar)、灰的(grizzly)、黑的(black)、棕的(brown)、泰迪(teddy)和俄国的(Russian),以及包括市场(markets)、打猎(hunt)和拥抱(hug)的非动物相关单词。翻译卡500还能够包括一个或多个图像。如图所示,翻译卡500包括分别与第一部分502a、第二部分502b、和第三部分502c相关联的三组图像536、540、544。第一图像集合536是北极熊,第二图像集合540是黑熊,以及第三图像集合544是灰熊。所有这些图像以及其划分成的集合还与例句:“多个熊的种类已经在动物园中杂交(Multiple bearspecies have been crossbred in zoos)”(即,北极熊、黑熊和灰熊各自是一个种类的熊)相关。

现在参考图6,示出单个翻译卡显示。例如,当计算装置108是具有相对较小显示器120的移动电话或平板计算机时,利用一次仅显示单个翻译卡的这个配置。标头600指示词性,并且用户116能够水平地滚动到不同词性(例如,从名词滚动到动词)。如图所示,显示翻译卡500的部分。在图示的示例中,翻译卡500还能够包括例句516的到西班牙语的翻译604(“Varias especies de osos se han cruzado en los zoológicos”),其中强调单词“bear”和“osos”二者。翻译卡500的显示部分还可以包括较少图像(例如,北极熊的一个图像和黑熊的一个图像),但是所显示的图像仍与例句516相关。

现在参考图7,图示用于提供包括上下文相关定义和示例的可视翻译卡的示例技术700的流程图。在704处,服务器104能够接收以源语言的选择单词。在708处,服务器能够获得选择单词的一个或多个词性。在712处,服务器104能够针对所述一个或多个词性中的每个,获得选择单词的到不同目标语言的候选翻译,每个候选翻译与选择单词的特定语义含义相对应。在716处,服务器104能够针对选择单词的每个语义含义,获得与选择单词的所述语义含义相对应的图像。在720处,服务器104能够针对选择单词的每个语义含义,编辑翻译信息,所述翻译信息包括(i)语义含义、(ii)相对应的词性、(iii)图像、以及(iv)至少一个相对应的候选翻译。在724处,服务器104能够输出该翻译信息,例如,将其输出到计算装置108。技术700然后能够结束或返回到704。

示例实施例被提供使得本公开将会是详尽的,并且将会充分地将该范围传达给本领域技术人员。阐述了许多具体细节,诸如特定组件、装置、和方法的示例,以提供对本公开的实施例的详尽理解。对于本领域技术人员将会显而易见的是,不需要采用具体细节,示例实施例可以以许多不同的形式被实施,并且不应当被解释为限制本公开的范围。在一些示例实施例中,不详细地描述公知的过程、公知的装置结构、和公知的技术。

本文中使用的术语仅用于描述特定示例实施例的目的,而不旨在是限制性的。如本文所使用的,单数形式“一”、“一个”和“该”还可以旨在包括复数形式,除非上下文中另有明确指示。术语“和/或”包括相关联的所列出的项中的一个或多个的任何和所有组合。术语“包含(comprises)”、“含有(comprising)”、“包括(including)”、和“具有”是包括性的,因此指定所陈述的特征、整体、步骤、操作、元件、和/或组件的存在,但并不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或组。本文中描述的方法步骤、过程、和操作不应当被解释为必须要求它们以所讨论或所图示的特定次序执行,除非被具体地标识为执行顺序。还应当理解的是,可以采用附加的或可替代的步骤。

尽管术语第一、第二、第三等可以在本文中被用于描述各种元件、组件、区域、层、和/或段,但这些元件、组件、区域、层和/或段不应当被这些术语限制。这些术语仅可以被用于将一个元件、组件、区域、层或段与另一个区域、层或段区分。诸如“第一”、“第二”、和其它数字术语的术语在本文中使用时不意味着序列或次序,除非由上下文清楚地指示。因此,在不脱离示例实施例的教导的情况下,以下讨论的第一元件、组件、区域、层或段可能被称为第二元件、组件、区域、层或段。

如本文所使用的,术语模块可以是指以下的一部分或包括以下:专用集成电路(ASIC);电子电路;组合逻辑电路;现场可编程门阵列(FPGA);处理器或分布式处理器网络(共享的、专用的、或分组的)和在执行代码或过程的网络集群或数据中心中存储器;提供所述功能的其它合适的组件;或上述的一些或全部的组合,诸如片上系统中。术语模块还可以包括存储由一个或多个处理器执行的代码的存储器(共享的,专用的、或分组的)。

如上所述,术语代码可以包括软件、固件、字节码和/或微代码,并且可以是指程序、例程、功能、类、和/或对象。如上所述,共享的术语意旨可以使用单个(共享)处理器执行来自多个模块的一些或全部代码。此外,来自多个模块的一些或所有代码可以由单个(共享的)存储器存储。如上所述,术语组意旨可以使用一组处理器来执行来自单个模块的一些或全部代码。此外,来自单个模块的一些或全部代码可以使用一组存储器来存储。

本文中描述的技术可以由一个或多个处理器执行的一个或多个的计算机程序来实施。计算机程序包括在非暂时有形计算机可读介质上存储的处理器可执行指令。计算机程序还可以包括存储的数据。非暂时有形计算机可读介质的非限制性示例是非易失性存储器、磁存储器、和光存储器。

就信息的操作的算法和符号表示而言,上述描述的一些部分呈现本文中所描述的技术。这些算法描述和表示是由数据处理领域的技术人员使用的最有效地将其工作的实质传达给本领域其他技术人员的手段。这些操作虽然在功能上或逻辑上被描述,但被理解为由计算机程序实施。此外,已经证实在不失一般性的情况下,还可以将这些操作排列作为模块或由功能名称来指代有时是方便的。

除非另有特别说明或从以上讨论中显而易见,应当显而易见的是,在整个说明书中,利用诸如“处理”或“计算”或“运算”或“确定”或“显示”等术语的讨论,是指计算机系统或类似的电子计算装置的动作和过程,其操纵和变换表示为计算机系统的存储器或寄存器或其它此类信息存储器、传输或显示装置内的物理(电子)量的数据。

所描述的技术的某些方面包括以算法的形式在本文中描述的处理步骤和指令。应当注意的是,所描述的处理步骤和指令可能被实现在软件、固件或硬件中,并且当在被实现在软件中时,可能被下载以驻留在由实时网络操作系统使用的不同平台上并且由其操作。

本公开还涉及一种用于执行本文中操作的设备。该设备可以是为了所需目的而特别构造的,或者其可以包括由在计算机可读介质上存储的计算机程序选择性地激活或重新配置的通用计算机,该计算机可读介质能够被该计算机访问。这样的计算机程序可以被存储在有形计算机可读存储介质中,诸如但不限于包括适于存储电子指令的软盘、光盘、CD-ROM、磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、磁或光卡、专用集成电路(ASIC)、或任何类型的媒介的任何类型盘,并且这些中的每个被耦合到计算机系统总线。此外,本说明书中提及的计算机可以包括单个处理器,或者可以是采用多个处理器设计、以增加计算能力的架构。

本文中呈现的算法和操作并不固有地与任何特定的计算机或其它设备相关。各种通用系统还可以根据本文中的教导与程序一起使用,或者可以证明构造更专用的设备以执行所需的方法步骤是方便的。针对各种这些系统的所需结构以及等同的变化对于本领域技术人员将是显而易见的。此外,本公开不参考任何特定的编程语言来描述。应当显而易见的是,可以使用各种编程语言来实施本文中所述的本公开的教导,并且提供对特定语言的任何引用以用于公开本发明的实现和最佳模式。

本公开非常适合于通过多种拓扑结构的各种计算机网络系统。在该领域内,大型网络的配置和管理包括通过诸如互联网的网络通信地耦合到不同计算机和存储装置的存储装置和计算机。

为了说明和描述的目的,已经提供对实施例的前述描述。这并不旨在是穷举或限制公开。特定实施例的单个元件或特征通常不限于该特定实施例,而是在可应用的情况下是可互换的,并且能够在所选择的实施例中使用,即使没有具体示出或描述。本发明还可以以许多方式变化。这些变化不被视为偏离本公开,并且所有这样的修改旨在被包括在本公开的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号