公开/公告号CN114861682A
专利类型发明专利
公开/公告日2022-08-05
原文格式PDF
申请/专利权人 杭州译友网络科技有限公司;
申请/专利号CN202210430363.3
申请日2022-04-22
分类号G06F40/58(2020.01);G06F40/211(2020.01);
代理机构北京索睿邦知识产权代理有限公司 11679;
代理人朱玲
地址 311121 浙江省杭州市余杭区仓前街道欧美金融城4幢1302室
入库时间 2023-06-19 16:17:34
法律状态公告日
法律状态信息
法律状态
2022-08-05
公开
发明专利申请公布
技术领域
本发明涉及计算机辅助翻译领域,具体涉及一种翻译记忆库的质量管理方法。
背景技术
CAT软件的功能是建立翻译记忆库并提供参考,既把过去翻译过的原文和译文的句子对存储在数据库中,在翻译新句子时就可以与翻译记忆库的句子对进行比较,如果有相同或相似的句子,调取出来供翻译新句子时参考,这样可以提高翻译的效率和质量。
但在实际工作中,现有的CAT软件依然存在很多问题:首先,用户在翻译过程中出现的误译、错译、少译、多译等各种错误,也会被记录到翻译记忆库内且难以得到校验和改正;其次,由于本地格式化的翻译方式缺少段落、图形、表格等语境,给译者翻译时的校对工作带来了很多不便和困难;除此之外,如果脱离了CAT环境直接对译文进行错误标注和修改,在翻译记忆库中难以被记录,导致其他译者在参考该译文时缺乏依据。
由于上诉问题的存在,不仅极大地阻碍了用户大规模应用翻译记忆库,也限制了翻译记忆库潜能的发挥。
发明内容
为了解决上述背景技术中提到的至少一个问题,本发明提出了一种翻译记忆库的质量管理方法。
一种翻译记忆库的质量管理方法,通过对翻译记忆库建立记录索引表和报误内容表,来对翻译记忆库进行管理,记录索引表的具体格式为:
{记忆单元ID,原文句子,译文句子,译者水平,被引次数,报误次数}
其中,记忆单元ID是生成的翻译记忆单元的标号,原文句子时翻译文件中需翻译的句子,译文句子是翻译记忆单元提供的译文,译者水平是生成该翻译记忆单元对应译者的水平等级,被引次数是该翻译记忆单元被引用的次数,报误次数是该记忆单元被报告错误的数,
报误内容表的具体格式为:
{记忆单元ID,报误编号,错误分类,备注}
其中,记忆单元ID为所提交错误报告翻译记忆单元的编号,报误编号是对该翻译记忆单元提交错误报告的编号,错误分类是该翻译记忆单元译文错误的类别,具体包括重大误译、误译、表达不通顺三种类别,备注是对该翻译记忆单元提交错误报告时增加的说明,
具体包括步骤:
步骤S1,导入翻译文件,并读取对应的译者等级,步骤如下:
步骤S101,导入翻译文件,读取翻译文件中待译的原文句子;
步骤S102,对待译的原文句子进行翻译,并从译者登记表中获取译者的水平等级。
步骤S2,设置记忆库筛选条件,根据待译句子来对所述记忆总库进行遍历,具体地,通过设置翻译记忆单元对应译者的翻译水平等级、翻译记忆单元被引用的次数和翻译记忆单元错误报告次数,来过滤匹配到的翻译记忆单元,进一步地,将符合筛选条件的翻译记忆单元提供给译者参考。
步骤S3,译者以提供的翻译记忆单元为参考来对翻译文件进行翻译,并对翻译记忆单元的内容进行判断,如果翻译记忆单元中可以引用,则执行翻译记忆单元被引的自动增加过程;如果译者发现该翻译记忆单元存在错误,则执行翻译记忆单元的报误标注过程;翻译结束后将译者水平等级、原文句子和译文句子作为一个翻译记忆单元增加到翻译记忆库中,步骤如下:
步骤S301,读取翻译文件中待翻译的原文句子,并将原文句子和提供的翻译记忆单元中的句子进行差分对比;
步骤S302,根据差分对比的结果对所有匹配的翻译记忆单元进行排序,并将排序后的翻译单元返回给译者;
步骤S303,基于查询到的译者水平等级、待译的原文句子和翻译后的译文句子,来生成所述翻译记忆单元,并将生成的翻译记忆单元存入翻译记忆库,进一步地,自动获得一个翻译记忆单元编号;
步骤S304,判断排序后的翻译记忆单元能否被引用和是否存在错误,如果该翻译记忆单元能够被引用,则执行翻译记忆单元被引的自动增加过程;如果发现该翻译记忆单元存在错误,则执行翻译记忆单元的报误标注过程,具体地,
翻译记忆单元被引的自动增加过程如下:
如果译者判断该翻译记忆单元可以引用,则把该翻译单元的译文提取到译文框,并通过修改翻译单元的译文得到待译原文句子的最终译文,进一步地,根据被引用的翻译记忆单元ID从翻译记忆库中找到该翻译记忆单元,并在该翻译记忆单元的记录索引表中的被引次数栏中,对被引次数的参数进行加1。
翻译记忆单元的报误标注过程如下:
如果译者发现该翻译记忆单元的译文有误,则译者根据译文的错误类别和对该错误报告的编号,来生成该翻译记忆单元的报误内容表,并在报误内容表中的备注栏说明译文的错误情况,具体地,是对该翻译记忆单元进行错误标记后生成对应的链接,当有其他译者需要查看该错误标记时,可以通过打开该报误内容表来查看对应译文错误标记的说明,进一步地,根据被标注错误的翻译记忆单元ID,从翻译记忆库中找到该翻译记忆单元,并在该翻译记忆单元的记录索引表中的报误次数栏中,对报误次数的参数进行加1。
步骤S4,重复步骤S1至S3,继续对翻译文件的进行下一处的翻译,直到完成翻译文件所有内容的翻译。
本发明提出了一种翻译记忆库的质量管理方法,与现有的技术相比,具有以下有益效果:
本发明通过对翻译记忆库引入一套可溯源、可跟踪、可汇报的翻译记忆库可信度的评价机制,实现了量化翻译记忆库匹配度计算标准的同时,还能够在译者参考翻译的过程中,动态地更新翻译记忆库,达到推荐最优翻译记忆库的目的;
本发明提出可以根据译者的需求增加筛选条件,来从记忆总库中筛选符合要求的翻译记忆库,满足了译者筛选最优翻译记忆库的个性化需求。
附图说明
图1是本发明的一种翻译记忆库的质量管理方法流程图。
图2是本发明实施例中记录索引表的说明图。
图3是本发明实施例中报误内容表的说明图。
具体实施方式
为了使本发明的目的、特征能够更加的明显和易懂,下面通过实施例并结合附图对本技术方案进行详细说明。
一种翻译记忆库的质量管理方法,通过对翻译记忆库建立记录索引表和报误内容表,来对翻译记忆库进行管理,如图2所示,记录索引表的具体格式为:
{记忆单元ID,原文句子,译文句子,译者水平,被引次数,报误次数}
其中,记忆单元ID是生成的翻译记忆单元的标号,原文句子时翻译文件中需翻译的句子,译文句子是翻译记忆单元提供的译文,译者水平是生成该翻译记忆单元对应译者的水平等级,被引次数是该翻译记忆单元被引用的次数,报误次数是该记忆单元被报告错误的数。
如图3所示,报误内容表的具体格式为:
{记忆单元ID,报误编号,错误分类,备注}
其中,记忆单元ID为所提交错误报告翻译记忆单元的编号,报误编号是对该翻译记忆单元提交错误报告的编号,错误分类是该翻译记忆单元译文错误的类别,具体包括重大误译、误译、表达不通顺三种类别,备注是对该翻译记忆单元提交错误报告时增加的说明。
如图1所示,本发明的翻译记忆库质量管理方法,具体步骤如下:
步骤S1,导入翻译文件,并读取对应的译者等级,具体过程为:
首先,导入翻译文件,读取翻译文件中待译的原文句子。
然后,对待译的原文句子进行翻译,并从译者登记表中获取译者的水平等级。
步骤S2,设置记忆库筛选条件,根据待译句子来对所述记忆总库进行遍历,具体地,通过设置翻译记忆单元对应译者的翻译水平等级、翻译记忆单元被引用的次数和翻译记忆单元错误报告次数,来过滤匹配到的翻译记忆单元,进一步地,将符合筛选条件的翻译记忆单元提供给译者参考。
步骤S3,译者以提供的翻译记忆单元为参考来对翻译文件进行翻译,并对翻译记忆单元的内容进行判断,如果翻译记忆单元中可以引用,则执行翻译记忆单元被引的自动增加过程;如果译者发现该翻译记忆单元存在错误,则执行翻译记忆单元的报误标注过程;翻译结束后将译者水平等级、原文句子和译文句子作为一个翻译记忆单元增加到翻译记忆库中,具体过程为:
首先,读取翻译文件中待翻译的原文句子,并将原文句子和提供的翻译记忆单元中的句子进行差分对比。
然后,根据差分对比的结果对所有匹配的翻译记忆单元进行排序,并将排序后的翻译单元返回给译者。
接着,基于查询到的译者水平等级、待译的原文句子和翻译后的译文句子,来生成所述翻译记忆单元,并将生成的翻译记忆单元存入翻译记忆库,进一步地,自动获得一个翻译记忆单元编号。
最后,判断排序后的翻译记忆单元能否被引用和是否存在错误。
如果译者判断该翻译记忆单元可以引用,则把该翻译单元的译文提取到译文框,并通过修改翻译单元的译文得到待译原文句子的最终译文,进一步地,根据被引用的翻译记忆单元ID从翻译记忆库中找到该翻译记忆单元,并在该翻译记忆单元的记录索引表中的被引次数栏中,对被引次数的参数进行加1。
如果译者发现该翻译记忆单元的译文有误,则译者根据译文的错误类别和对该错误报告的编号,来生成该翻译记忆单元的报误内容表,并在报误内容表中的备注栏说明译文的错误情况,具体地,是对该翻译记忆单元进行错误标记后生成对应的链接,当有其他译者需要查看该错误标记时,可以通过打开该报误内容表来查看对应译文错误标记的说明,进一步地,根据被标注错误的翻译记忆单元ID,从翻译记忆库中找到该翻译记忆单元,并在该翻译记忆单元的记录索引表中的报误次数栏中,对报误次数的参数进行加1。
步骤S4,重复步骤S1至S3,继续对翻译文件的进行下一处的翻译,直到完成翻译文件所有内容的翻译。
至此,按照本发明公开的方法,已实施完一次本发明的工作过程。
虽然,本说明书中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
机译: 翻译记忆库,包括子翻译记忆库,使用翻译记忆库和计算机可读存储介质相同且可读取的逆转翻译记忆库和逆向翻译记忆库
机译: 包含小翻译记忆库,使用相同翻译的向后翻译记忆库以及记录有翻译记忆库的计算机可读存储介质的翻译记忆库
机译: 提高翻译记忆库覆盖率和质量的方法