首页> 中国专利> 一种拆分式人工智能翻译方法

一种拆分式人工智能翻译方法

摘要

本发明的一种拆分式人工智能翻译方法,属于智能翻译技术领域,包括以下步骤:S1,导入文献;S2,遍历文献,将文献分拆成若干份子文献;S3,分别对每一份子文献进行断句得到单句,并依次对每一单句进行序号标示;S4,提取单句中的名词并进行初步释义得到单句关键词;S5,翻译每一单句得到释义句;S6,根据释义句的前句内的单句关键词并进行近意调整;S7,排列所有调整后的释义句得到译文并显示,此发明的翻译方法,翻译速度快,语意准确,效率高。

著录项

  • 公开/公告号CN112487831A

    专利类型发明专利

  • 公开/公告日2021-03-12

    原文格式PDF

  • 申请/专利权人 江苏省舜禹信息技术有限公司;

    申请/专利号CN202011352378.X

  • 发明设计人 单杰;王璐;杨丽;

    申请日2020-11-27

  • 分类号G06F40/58(20200101);G06F40/284(20200101);G06F40/30(20200101);

  • 代理机构11489 北京中政联科专利代理事务所(普通合伙);

  • 代理人谢恺

  • 地址 210019 江苏省南京市建邺区白龙江东街19号舜禹大厦21-23层

  • 入库时间 2023-06-19 10:11:51

说明书

技术领域

本发明属于智能翻译技术领域,更具体来说,涉及一种拆分式人工智能翻译方法。

背景技术

对于现在的社会,国际交上的交流成家常便饭。随之带来的翻译量越来越大,文件字数越来越多。

以现在CAT技术的流行,翻译速度大大提升。但是在翻译前的准备过程往往占据了相当长的时间。例如对于翻译公司来说,一份约3万字的文件分别给10个人做,在前期需要用时半天甚至更久的时间来完成文件拆分和分配。更严重的事,犹豫文字过多,很容易导致分割时视觉混淆导致拆分有误。许多文件中会有很多段落是完全相同的,这样翻译只是多了一些无用的事。这样无形的增加了翻译成本。

而目前市面上所有的拆分工具器目的是为了将文件化整为零,方便携带,其算法按字节流分割。此方法对文字的分割基本是无用的。所以翻译界在翻译文字过多文件时往往需要多个人同时进行翻译,翻译前都会花大量时间用于文字的拆分。

因此需要一种翻译工具直接拆分文献,同时拆分后的翻译之间互有关联,避免翻译前后语意不搭。

发明内容

1.发明要解决的技术问题

本发明的目的在于解决上述缺陷。

2.技术方案

为达到上述目的,本发明提供的技术方案为:

本发明的一种拆分式人工智能翻译方法,包括如下步骤:

S1,导入文献;

S2,遍历文献,将文献分拆成若干份子文献;

S3,分别对每一份子文献进行断句得到单句,并依次对每一单句进行序号标示;

S4,提取单句中的名词并进行初步释义得到单句关键词;

S5,翻译每一单句得到释义句;

S6,根据释义句的前句内的单句关键词并进行近意调整;

S7,排列所有调整后的释义句得到译文并显示。

优选的,步骤S3的标号方法为n-k,其中n表示子文献的序号,k表示子文献内单句的序号,n和k均为自然数。

优选的,步骤S5之后还存在如下步骤:

S5.1,排列单句关键词的多种释义并依次选定;

S5.2,根据选定单句关键词的释义与下一单句是释义句进行对比,判断是否存在逻辑关系,若存在则进行步骤S6,否则回到步骤S5.1,直到单句关键词的释义全部判断完毕。

优选的,步骤S6之后还存在如下步骤:

S6.1,对近意调整后的单句进行下划线处理;

S6.2,对具有下划线的单句进行多意义翻译;

S6.3,多意义翻译后的单句形成超链接并于下划线绑定;

优选的,步骤S7之前还存在如下步骤:

S6.4,提取每个子文献内出现次数超过两次的主语;

S6.5,判断原文相同的主语翻译后的译文中主语的翻译结果是否相同,若是则正常显示,否则进行步骤S6.6;

S6.6,将不同翻译结果的主语显示为可编辑状态且添加背景色并显示。

优选的,步骤S7之后还存在如下步骤:

S8,判断操作者是否修改译文内的文字,若是则将修改后的部分和原文进行打包整合得到归纳文档,否则不进行任何操作;

S8.1,将归纳文档上传至云端。

优选的,步骤S6中,若翻译的句子为首句,则直接翻译内容。

优选的,步骤S2中拆分的方法为,判断文献是否存在多个段落,若是则以段落为结构进行拆分,否则以句子为结构进行拆分。

优选的,步骤S6的近意调整的方法为,根据云端大数据来选择匹配语义中使用较多的词义。

3.有益效果

采用本发明提供的技术方案,与现有技术相比,具有如下有益效果:

(1)本发明的一种拆分式人工智能翻译方法,将文献拆分成多个子文献,进行同步翻译,节约了翻译时间。

(2)本发明的一种拆分式人工智能翻译方法,翻译子文献时,除首句外,其余句子的翻译均根据上一句的关键名词进行近意调整,提高翻译的准确率和信雅达。

(3)本发明的一种拆分式人工智能翻译方法,所有子文献翻译完成后,系统根据子文献内出现的主语进行调整统一,配合人工干预,提高准确率和系统学习能力,进一步反馈给云端大数据。

附图说明

图1为本发明的一种拆分式人工智能翻译方法的流程图

具体实施方式

为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述,附图中给出了本发明的若干实施例,但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件;本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同;本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

参照附图1所示,本实施例的一种拆分式人工智能翻译方法,包括如下步骤:

S1,导入文献;

S2,遍历文献,将文献分拆成若干份子文献;

S3,分别对每一份子文献进行断句得到单句,并依次对每一单句进行序号标示;

S4,提取单句中的名词并进行初步释义得到单句关键词;

S5,翻译每一单句得到释义句;

S6,根据释义句的前句内的单句关键词并进行近意调整;

S7,排列所有调整后的释义句得到译文并显示。

本实施例的步骤S3的标号方法为n-k,其中n表示子文献的序号,k表示子文献内单句的序号,n和k均为自然数。

本实施例的步骤S5之后还存在如下步骤:

S5.1,排列单句关键词的多种释义并依次选定;

S5.2,根据选定单句关键词的释义与下一单句是释义句进行对比,判断是否存在逻辑关系,若存在则进行步骤S6,否则回到步骤S5.1,直到单句关键词的释义全部判断完毕。

本实施例的步骤S6之后还存在如下步骤:

S6.1,对近意调整后的单句进行下划线处理;

S6.2,对具有下划线的单句进行多意义翻译;

S6.3,多意义翻译后的单句形成超链接并于下划线绑定;

本实施例的步骤S7之前还存在如下步骤:

S6.4,提取每个子文献内出现次数超过两次的主语;

S6.5,判断原文相同的主语翻译后的译文中主语的翻译内容是否相同,若是则正常显示,否则进行步骤S6.6;

S6.6,将翻译内容不同的主语显示为可编辑状态且添加背景色并显示。

本实施例的步骤S7之后还存在如下步骤:

S8,判断操作者是否修改译文内的文字,若是则将修改后的部分和原文进行打包整合得到归纳文档,否则不进行任何操作;

S8.1,将归纳文档上传至云端。

本实施例的步骤S6中,若翻译的句子为首句,即序号为n-1的句子,则直接翻译内容。

本实施例的步骤S2中拆分的方法为,判断文献是否存在多个段落,若是则以段落为结构进行拆分,否则以句子为结构进行拆分。

本实施例的步骤S6的近意调整的方法为,根据云端大数据来选择匹配语义中使用较多的词义。

针对上述实施例,进行举例说明,如下:

例1,现有一篇文献,文献包含7个段落,每个段落5句,假设该文献遍历后分为七个子文献,则子文献的序号为1至7,每个子文献内的句子序号为1-5,现翻译第二子文献的第三句,即序号2-3,翻译时,系统提取序号为2-2内的名词作为关键词,并翻译2-3,根据2-2内的关键词调整近意调整2-3的释义,调整后的2-3释义句进行下划线标记,下划线超链接内包含2-3调整前的原意以及大数据显示的常用意,按照上述过程对每一个子文献内的每一句进行翻译调整最后得到译文,得到译文后,提取每个子文献内的名词并判断相同名词的翻译是否相同,进行最后调整和操作者手工干预,最后显示译文并将操作者手工干预的结果打包传递至云端进行大数据整合。

例2,现有一篇文献,只包含1个段落,该段落仅有1句,则遍历文献后,将该句表示为1-1,翻译1-1时,由于判定1-1为首句,则直接翻译并显示结果,若操作者手动修改了某些释义则将修改后的内容整合打包传递至云端。

以上所述实施例仅表达了本发明的某种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,本发明专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号