公开/公告号CN112487828A
专利类型发明专利
公开/公告日2021-03-12
原文格式PDF
申请/专利权人 江苏省舜禹信息技术有限公司;
申请/专利号CN202011352369.0
申请日2020-11-27
分类号G06F40/44(20200101);G06F40/58(20200101);
代理机构11489 北京中政联科专利代理事务所(普通合伙);
代理人谢恺
地址 210019 江苏省南京市建邺区白龙江东街19号舜禹大厦21-23层
入库时间 2023-06-19 10:11:51
技术领域
本发明属于翻译技术领域,更具体来说,涉及一种纠错改进型译文大数据整合方法。
背景技术
对于现在的社会,国际交上交流越来越频繁。随之带来的翻译量越来越大,文件字数越来越多。
翻译的准确度由翻译系统控制,由于翻译是机器翻译,因此无法做到完美翻译,需要对翻译结果进行多次修改编辑,以达到比较符合原意的翻译结果,同时该修改的方法和结果作为对照方案收录进云端,提高机器的学习能力。
发明内容
1.发明要解决的技术问题
本发明的目的在于解决现有中翻译机器翻译千篇一律,翻译结果不太符合原意的缺陷。
2.技术方案
为达到上述目的,本发明提供的技术方案为:
本发明的一种纠错改进型译文大数据整合方法,方法包括以下步骤:
S1,导入文献;
S2,系统对文献进行直译得到译文一;
S3,系统对文献进行人工智能纠正得到译文二;
S4,显示译文二的编辑界面;
S5,判断编辑界面下的译文二是否被人工修改,若是则将修改后的译文整合为译文三并进入步骤S6,若否则直接进入步骤S6;
S6,遍历原文、译文一、译文二和译文三;
S7,选出译文一、译文二和译文三中不一样的句子并从前到后排列整合成若干个数据包;
S8,在S7选出的若干个数据包中分别注释原文中对应的原句的名词和动词得到关键词包;
S9,传入云端进行数据处理。
优选的,步骤S1之后还有以下步骤:
S1.1,对文献进行断句,依次对每句进行标号,记为Y-n,其中n为自然数。
优选的,步骤S2之后还有以下步骤:
S2.1,对译文一进行断句,依次对每句进行标号,记为O-n,其中n为自然数;
S2.2,整合Y-n与O-n,记为YO-n,表示第n句的原文和译文一,其中n为自然数。
优选的,步骤S3之后还有以下步骤:
S3.1,对译文二进行断句,依次对每句进行标号,记为T-n,其中n为自然数;
S3.2,整合YO-n与T-n,记为YOT-n,表示第n句的原文、译文一和译文二,其中n为自然数。
优选的,步骤S6之后还有以下步骤:
S6.1,判断遍历之后是否存在译文三,若存在则进入步骤S6.2,否则进入步骤S7;
S6.2,对译文三进行断句,依次对每句进行标号,记为S-n,其中n为自然数;
S6.3,整合YOT-n与S-n,记为YOTS-n,表示第n句的原文、译文一、译文二和译文三,其中n为自然数。
优选的,步骤S9之后还有以下步骤:
S9.1,根据关键词包从云端调取包含相关名词和动词的存库语句;
S9.2,分析存库语句和YOT-n,进行对比,选出出现概率高的词句显示;
S9.3,系统将YOT-n收入库中,并进行归纳计算出现次数。
3.有益效果
采用本发明提供的技术方案,与现有技术相比,具有如下有益效果:
(1)本发明的一种纠错改进型译文大数据整合方法,该方法对翻译结果进行纠错和反馈处理,保证了翻译的准确度,同时修改的过程,机器转换翻译内容的结果都会被收录进云端,作为下次翻译的对照,提高了系统的学习能力,进一步是的机器翻译的效果更好。
附图说明
图1为本发明的一种纠错改进型译文大数据整合方法的流程图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述,附图中给出了本发明的若干实施例,但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件;本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同;本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例1
参照附图1所示,本实施例的一种纠错改进型译文大数据整合方法,方法包括以下步骤:
S1,导入文献;
S2,系统对文献进行直译得到译文一;
S3,系统对文献进行人工智能纠正得到译文二;
S4,显示译文二的编辑界面;
S5,判断编辑界面下的译文二是否被人工修改,若是则将修改后的译文整合为译文三并进入步骤S6,若否则直接进入步骤S6;
S6,遍历原文、译文一、译文二和译文三;
S7,选出译文一、译文二和译文三中不一样的句子并从前到后排列整合成若干个数据包;
S8,在S7选出的若干个数据包中分别注释原文中对应的原句的名词和动词得到关键词包;
S9,传入云端进行数据处理。
本实施例的步骤S1之后还有以下步骤:
S1.1,对文献进行断句,依次对每句进行标号,记为Y-n,其中n为自然数。
本实施例的步骤S2之后还有以下步骤:
S2.1,对译文一进行断句,依次对每句进行标号,记为O-n,其中n为自然数;
S2.2,整合Y-n与O-n,记为YO-n,表示第n句的原文和译文一,其中n为自然数。
本实施例的步骤S3之后还有以下步骤:
S3.1,对译文二进行断句,依次对每句进行标号,记为T-n,其中n为自然数;
S3.2,整合YO-n与T-n,记为YOT-n,表示第n句的原文、译文一和译文二,其中n为自然数。
本实施例的步骤S6之后还有以下步骤:
S6.1,判断遍历之后是否存在译文三,若存在则进入步骤S6.2,否则进入步骤S7;
S6.2,对译文三进行断句,依次对每句进行标号,记为S-n,其中n为自然数;
S6.3,整合YOT-n与S-n,记为YOTS-n,表示第n句的原文、译文一、译文二和译文三,其中n为自然数。
本实施例的步骤S9之后还有以下步骤:
S9.1,根据关键词包从云端调取包含相关名词和动词的存库语句;
S9.2,分析存库语句和YOT-n,进行对比,选出出现概率高的词句显示;
S9.3,系统将YOT-n收入库中,并进行归纳计算出现次数。
上述方法对翻译结果进行纠错和反馈处理,保证了翻译的准确度,同时修改的过程,机器转换翻译内容的结果都会呗收录进云端,作为下次翻译的对照,提高了系统的学习能力,进一步是的机器翻译的效果更好。
以上所述实施例仅表达了本发明的某种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,本发明专利的保护范围应以所附权利要求为准。
机译: 使用高性能计算(HPC)使用前向纠错的大数据流重新组装多路径消息分发和消息。
机译: 使用高性能计算(HPC)使用前向纠错的大数据流重新组装多路径消息分发和消息。
机译: 使用高性能计算(HPC)使用前向纠错的大数据流重新组装多路径消息分发和消息