首页> 中国专利> 一种翻译行业风险项目通用推荐译员方法

一种翻译行业风险项目通用推荐译员方法

摘要

本发明提供了一种翻译行业风险项目通用推荐译员方法,涉及互联网翻译行业项目智能处理技术领域,包括:将待翻译稿件的属性特征,分别与每个译员对应的属性特征进行首次匹配;同时,将待翻译稿件的稿件特征同每个译员的历史翻译的稿件特征进行相似度匹配;对两次匹配结果进行加权分析,从分析结果中选择出匹配程度最高的数据所对应的译员。解决了现有技术不能筛选出符合用户翻译稿件需求的译员的问题。

著录项

  • 公开/公告号CN105138521A

    专利类型发明专利

  • 公开/公告日2015-12-09

    原文格式PDF

  • 申请/专利权人 武汉传神信息技术有限公司;

    申请/专利号CN201510534939.0

  • 发明设计人 江潮;陈钰清;

    申请日2015-08-27

  • 分类号G06F17/28(20060101);G06F17/30(20060101);

  • 代理机构11331 北京康盛知识产权代理有限公司;

  • 代理人张宇峰

  • 地址 430073 湖北省武汉市东湖新技术开发区软件园中路4号光谷E城E2栋五楼

  • 入库时间 2023-12-18 12:45:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-26

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/28 变更前: 变更后: 申请日:20150827

    专利权人的姓名或者名称、地址的变更

  • 2017-12-22

    授权

    授权

  • 2016-01-06

    实质审查的生效 IPC(主分类):G06F17/28 申请日:20150827

    实质审查的生效

  • 2015-12-09

    公开

    公开

说明书

技术领域

本发明涉及互联网翻译行业项目智能处理技术领域,特别是涉及一种翻 译行业风险项目通用推荐译员方法。

背景技术

随着互联网的兴起,一些中大型的翻译公司都将通过平台在线规模化处 理翻译项目,这样可以极大提高处理效率和产能。但同时对于风险项目的保 质,按时交付一直是一个棘手且严峻的问题。一个风险项目的特征通常满足 以下几个条件:

(1)稿件非常难,能翻译此稿件译员较少;

(2)稿件所剩的交付时间太少,大多数译员不愿意领取;

(3)稿件价格太便宜,大多数译员不愿领取;

(4)稿件要求提交时间比较短(例如30分钟)但平台译员不活跃,导致稿 件不能及时领取,出现风险。

发明内容

本发明所要解决的技术问题是现有技术不能筛选出符合用户翻译稿件 需求的译员。

为了解决上述问题,本发明公开了一种翻译行业风险项目通用推荐译员 方法,包括:

将待翻译稿件的属性特征,分别与每个译员对应的属性特征进行首次匹 配:

同时,将待翻译稿件的稿件特征同每个译员的历史翻译的稿件特征进行 相似度匹配:

对两次匹配结果进行加权分析,从分析结果中选择出匹配程度最高的数 据所对应的译员。

进一步,所述首次匹配的过程为:

根据所述译员的属性特征和待翻译稿件的属性特征进行对比筛选,对筛 选后的译员的每个属性特征进行归一化处理和偏离度计算。

进一步,所述待翻译稿件的属性特征至少包括以下之一:所述待翻译稿 件的语种、所述待翻译稿件涉及的行业领域、所述待翻译稿件所属稿件类型、 所述待翻译稿件对语言能力质量的要求、所述待翻译稿件对专业能力质量的 要求、所述待翻译稿件对翻译速度的要求、所述待翻译稿件提供的翻译价格。

进一步,所述译员对应的属性特征至少包括从存储译员的各属性特征的 译员基因库中提取出的评价所述译员能力的能力属性特征,所述能力属性特 征至少包括以下之一:译员擅长翻译的语种、译员擅长翻译的行业领域、译 员擅长翻译的稿件类型、译员翻译稿件的速度、评价译员语言能力的评级、 评价译员的专业能力评级、译员翻译稿件的价格。

进一步,所述归一化处理的方法为:

y=(x-MinValue)/(MaxValue-MinValue),

其中x为当前译员的当前属性特征的对应值,MaxValue、MinValue分别 为全部所述译员中筛选的当前属性特征的最大值和最小值;y为归一化处理 的结果:

所述偏离度计算的方法为:

Dev=sin((ProperyValue/20-1))*(2/pi)

其中:

ProperyValue表示经归一化处理后的译员的当前属性特征值;

Dev为所述译员的当前属性特征的偏离度值。

进一步,所述相似度匹配的过程包括:

根据所述译员的历史翻译稿件的属性特征和待翻译稿件的属性特征进 行对比筛选,筛选选取出属性特征相接近的译员进行相似度匹配;

从待翻译稿件中提取稿件的关键词代替待翻译稿件文本本身参与匹配;

从译员历史翻译稿件中提取稿件的关键词代替译员历史翻译稿件文本 本身参与匹配;

根据译员历史翻译稿件的关键词和待翻译稿件的关键词建立向量空间 模型,所述向量空间模型为:

D1=(T11,W11;T12,W12;T13,W13;……;T1n,W1n);

D2=(T21,W21;T22,W22;T23,W23;……;T2n,W2n):

其中D1表示待翻译稿件的文本,D2表示当前译员的当前历史翻译稿件 的文本:

T1i(i=1,2,3……,n)为待翻译稿件提取出的各个关键词,i为关键 词的编号;

W1i(i=1,2,3……,n)为待翻译稿件提取出的各个关键词出现的频 次,i为关键词的编号;

T2i(i=1,2,3……,n)为当前译员的当前历史翻译稿件中提取出的各 个关键词,i为关键词的编号;

W2i(i=1,2,3……,n)为当前译员的当前历史翻译稿件中提取出的 各个关键词出现的频次,i为关键词的编号;

根据公式:SIM=SIM(D1,D2)=ΣK-1nW1k×W2k(Σk-1nW1K2)(Σk-1nW2K2),计算出当前译员的当前历史 稿件同待翻译稿件的相似度,式中SIM为相似度匹配后的相似度值,数值介 于0~1之间。

进一步,所述历史翻译稿件的属性特征至少包括以下之一:所述历史翻 译稿件的语种、所述历史翻译稿件涉及的行业领域、所述历史翻译稿件所属 稿件类型、所述历史翻译稿件对语言能力质量的要求、所述历史翻译稿件对 专业能力质量的要求、所述历史翻译稿件对提交时间的要求、所述历史翻译 稿件的字数、所述历史翻译稿件提供的翻译价格。

进一步,所述加权分析的方法为:

Sum=A1*W1*D1+A2*W2*D2+...An*Wn*Dn+SIM*SIMW:

其中:Sum为加权分析后的结果;

Ai(i=1,2,3,……,n)为参加权分析的经归一化处理后的每个所述译员的 属性特征,i为每个所述译员在系统中的编号;

Wi(i=1,2,3,……,n)为经归一化处理后的每个所述译员的属性特征所对 应的权重值,i为每个所述译员在系统中的编号;

Di(i=1,2,3,……,n)为经归一化处理后的每个所述译员的属性特征所对 应的偏离度的值,i为每个所述译员在系统中的编号;

SIM为相似度匹配对应的相似度值:

SIMW为相似度匹配的相似度值所对应的权重值。

进一步,经过首次匹配和再次匹配选择出匹配程度最高的推荐译员后, 还包括:

根据用户反馈信息调整的过程:

将匹配程度最高的推荐译员的信息提交给用户,提取用户对译员的评价 信息;根据用户对译员的评价信息,修正所述译员的属性特征,并重新进行 提取所述待翻译稿件的属性特征,分别与每个译员对应的属性特征进行再次 匹配的过程。

与现有技术相比,本发明具有以下优点:

本发明提供了一种翻译行业风险项目通用推荐译员方法,可以依据此方 法建立风险项目推荐译员平台,能够方便快捷对接中大型翻译公司在线交付 平台,为其风险项目推荐合适译员,极大提高其风险项目处理能力。

附图说明

图1是本发明的优选实施例的匹配方法的流程示意图;

图2是本发明的优选实施例的待翻译稿件的属性特征;

图3是本发明的优选实施例的匹配方法的流程示意图;

图4是本发明的优选实施例的匹配方法的流程示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图 和实施例作进一步详细的说明。

如图1所示,在本发明的优选实施例中,提供了一种翻译行业风险项目 通用推荐译员方法,包括:

将待翻译稿件的属性特征和每个译员的历史翻译稿件的属性特征分别 进行首次匹配:

同时,将所述待翻译稿件的属性特征,分别与每个译员对应的属性特征 再次匹配:

对两次匹配结果进行加权分析,从分析结果中选择出匹配程度最高的数 据所对应的译员。

所述首次匹配的过程为:

根据所述译员的属性特征和待翻译稿件的属性特征进行对比筛选,对筛 选后的译员的每个属性特征进行归一化处理和偏离度计算。

在优选的实施例中,所述待翻译稿件的属性特征至少包括以下特征之 一:包括:

所述待翻译稿件的语种、所述待翻译稿件涉及的行业领域、所述待翻译 稿件所属稿件类型、所述待翻译稿件对语言能力质量的要求、所述待翻译稿 件对专业能力质量的要求、所述待翻译稿件对提交时间的要求、所述待翻译 稿件的字数、所述待翻译稿件提供的翻译价格。

待翻译稿件的语种为稿件的翻译语种方向,例如,中对英、英对中、中 对日、日对中等。待翻译稿件涉及的行业领域例如石油化工领域、航天航空 领域、网络信息技术领域等。待翻译稿件所属稿件类型包括:合同、短件、 宣传稿、信件、论文等。待翻译稿件对语言能力质量的要求是指稿件在语言 能力上的评级,具体从低到高分为t0级到t9级。待翻译稿件对专业能力质 量的要求是指稿件在专业能力上的评级,具体从低到高分为p0级到p9级。

如图2所示,一篇待翻译稿件的属性特征为:翻译语种方向为中文简体 -俄文;稿件类型为宣传稿;对语言能力质量要求为不低于t4级;对专业能 力的质量要求为不低于p4级;稿件字数为50字;所提供的翻译价格为6.5 元。

所述译员的属性特征包括从存储译员的各属性特征的译员基因库中提 取出的评价译员能力的能力属性特征,能力属性特征至少包括以下之一:

译员擅长翻译的语种,如:英语、日语、法语、德语等;译员擅长翻译 的行业领域,如:石油化工领域、航天航空领域、网络信息技术领域等;译 员擅长翻译的稿件类型,如:合同、短件、宣传稿、信件、论文等;译员翻 译稿件的速度,一般评价为译员每天所能翻译的字数;评价译员语言能力的 评级,具体从低到高分为t0级到t9级;评价译员专业能力的评级,具体从 低到高分为p0级到p9级;译员对于翻译稿件的价格要求。

先根据译员的属性特征同待翻译稿件的属性特征进行筛选,按照待翻译 稿件的基本要求筛选出基本符合标准的译员。筛选之后对译员的每个属性特 征进行归一化处理和偏离度计算。

在筛选的过程中,根据如下匹配过程来进行筛选:

将待翻译稿件的语种同译员擅长翻译的语种进行匹配;

将待翻译稿件设计的行业领域同译员擅长翻译的行业领域进行匹配;

将待翻译稿件所述的稿件类型同译员擅长翻译的稿件类型进行匹配;

将待翻译稿件对于语言能力质量的要求同译员语言能力评级进行匹配;

将待翻译稿件对专业能力质量的要求同译员专业能力的评级进行匹配;

将待翻译稿件提供的翻译价格同译员对于翻译稿件的价格要求进行匹 配:

将根据待翻译稿件对提交时间的要求以及待翻译稿件的字数计算出的 待翻译稿件的翻译速度要求同译员翻译稿件的速度进行匹配。

通过上述筛选过程可以选出基本符合要求的译员进行进一步的匹配处 理以选出最合适的译员。

在优选的实施例中,在筛选出基本符合待翻译稿件翻译要求的译员后, 需对译员的属性特征进行归一化处理,归一化处理的方法依据的公式为:

y=(x-MinValue)/(MaxValue-MinValue),

其中x为当前译员的当前属性特征的对应值,MaxValue、MinValue分别 为全部所述译员中筛选的当前属性特征的最大值和最小值;y为归一化处理 的结果:

进行归一化处理的目的是让参与加权计算的“可量化”的译员基因的数 据级量保持一致。

在归一化处理后需进行偏离度计算,偏离度的计算依据的公式为:

Dev=sin((ProperyValue/20-1))*(2/π)

其中,ProperyValue表示经归一化处理后的译员的属性特征的值;

Dev为计算后获得的译员的当前属性特征的偏离度值。

偏离度的意义在于选择合适的译员。例如,一个待翻译稿件要求译员的 翻译速度为3000字/天,则根据本发明的匹配方法不会推荐与此值相差太多 的译员,例如,速度6000,7000,8000等,选用这些译员太浪费资源。相 反根据偏离度计算的结果会根据速度权重情况选择翻译速度在3000上下浮 动较小的译员。

在进行首次匹配的同时,将待翻译稿件的稿件特征同每个译员的历史翻 译的稿件特征进行相似度匹配。

所述相似度匹配的过程包括:

根据所述译员的历史翻译稿件的属性特征和待翻译稿件的属性特征进 行对比筛选,筛选选取出属性特征相接近的译员进行相似度匹配;

从待翻译稿件中提取稿件的关键词代替待翻译稿件文本本身参与匹配;

从译员历史翻译稿件中提取稿件的关键词代替译员历史翻译稿件文本 本身参与匹配;

根据译员历史翻译稿件的关键词和待翻译稿件的关键词建立向量空间 模型,所述向量空间模型为:

D1=(T11,W11;T12,W12;T13,W13;……;T1n,W1n);

D2=(T21,W21;T22,W22;T23,W23;……;T2n,W2n):

其中D1表示待翻译稿件的文本,D2表示当前译员的当前历史翻译稿件 的文本:

T1i(i=1,2,3……,n)为待翻译稿件提取出的各个关键词,i为关键 词的编号;

W1i(i=1,2,3……,n)为待翻译稿件提取出的各个关键词出现的频 次,i为关键词的编号;

T2i(i=1,2,3……,n)为当前译员的当前历史翻译稿件中提取出的各 个关键词,i为关键词的编号;

W2i(i=1,2,3……,n)为当前译员的当前历史翻译稿件中提取出的 各个关键词出现的频次,i为关键词的编号;

根据公式:SIM=SIM(D1,D2)=ΣK-1nW1k×W2k(Σk-1nW1K2)(Σk-1nW2K2),计算出当前译员的当前 历史稿件同待翻译稿件的相似度,式中SIM为相似度匹配后的相似度值,数 值介于0~1之间。

所述历史翻译稿件的属性特征至少包括以下之一:所述历史翻译稿件的 语种、所述历史翻译稿件涉及的行业领域、所述历史翻译稿件所属稿件类型、 所述历史翻译稿件对语言能力质量的要求、所述历史翻译稿件对专业能力质 量的要求、所述历史翻译稿件对提交时间的要求、所述历史翻译稿件的字数、 所述历史翻译稿件提供的翻译价格。

历史翻译稿件的语种为稿件的翻译语种方向,例如,中对英、英对中、 中对日、日对中等。历史翻译稿件涉及的行业领域例如石油化工领域、航天 航空领域、网络信息技术领域等。历史翻译稿件所属稿件类型包括:合同、 短件、宣传稿、信件、论文等。历史翻译稿件对语言能力质量的要求是指稿 件在语言能力上的评级,具体从低到高分为t0级到t9级。历史翻译稿件对 专业能力质量的要求是指稿件在专业能力上的评级,具体从低到高分为p0 级到p9级。

根据所述译员的历史翻译稿件的属性特征和待翻译稿件的属性特征进 行筛选,筛选出基本相似的译员历史翻译稿件,可以减小相似性匹配的工作 量。

完成两次匹配后,对两次匹配结果进行加权分析,从分析结果中选择出 匹配程度最高的数据所对应的译员。

所述加权分析的方法为:

Sum=A1*W1*D1+A2*W2*D2+...An*Wn*Dn+SIM*SIMW:

其中:Sum为加权分析后的结果;

Ai(i=1,2,3,……,n)为参加权分析的经归一化处理后的每个所述译员的 属性特征,i为每个所述译员在系统中的编号;

Wi(i=1,2,3,……,n)为经归一化处理后的每个所述译员的属性特征所对 应的权重值,i为每个所述译员在系统中的编号;

Di(i=1,2,3,……,n)为经归一化处理后的每个所述译员的属性特征所对 应的偏离度的值,i为每个所述译员在系统中的编号;

SIM为相似度匹配对应的相似度值:

SIMW为相似度匹配的相似度值所对应的权重值。

在优选的实施例中,经过首次匹配和再次匹配选择出匹配程度最高的推 荐译员后,还包括:

根据用户反馈信息调整的过程:

输出匹配程度最高的推荐译员的信息,接收对所述推荐译员的修正值;

根据所述修正值,修正所述译员的属性特征,并重新进行首次匹配和相 似度匹配的操作。

该过通过用户的评价判断一个译员是否符合当前待翻译稿件的翻译工 作需求,使得译员的选择更符合用户的标准。

在一些说明性实施例中,可以不执行用户反馈信息调整过程,此时所述 翻译稿件的匹配的方法的流程图如图3所示。

根据上述技术方案提供的翻译稿件匹配方法,可以通过计算机编程实现 构建一个风险项目推荐译员平台,该平台存储大量译员的基本信息即上述译 员的属性特征和译员历史翻译稿件,包含上述历史翻译稿件的属性特征,用 户只需输入待翻译稿件的属性特征和待翻译稿件文本即可通过该平台匹配 获得推荐译员,同时用户可对推荐译员进行评价并重新匹配,以选取更加合 适的译员。

在一些说明性实施例中,在首次匹配筛选译员的过程中,除了根据待翻 译稿件的属性特征同评价译员能力的属性特征匹配程度较高进行筛选外,还 需综合考量译员的翻译经验和信用情况,通过引入用于评价翻译经验的经验 属性特征和评价译员信用的信用属性特征来综合判断译员是否适合待翻译 稿件的翻译工作。

所述经验属性特征至少包含以下特征之一:

用于评价译员历史翻译稿件数量的译员合作字数属性特征,具体指统计 在系统内的译员参与翻译(包括合作翻译的)的稿件的字数的总量;

用于评价译员历史参与稿件翻译数量的译员合作次数属性特征,具体指 统计在系统内的译员参与翻译(包括合作翻译的)的稿件的总次数;

用于评价译员参与稿件翻译工作活跃程度的活跃度属性特征,具体指近 期内(默认一个月),译员参与翻译的稿件次数。

所述信用属性特征至少包括以下特征之一:

用于评价译员是否能够按时提交翻译稿件的按时提交率属性特征;

用于评价译员历史翻译稿件过程中弃稿情况的中途弃稿率属性特征;

用于评价译员对于翻译稿件的完成质量的责任心属性特征。

根据用户反馈信息调整的过程中根据用户信息进行修正调整的译员属 性基因主要为上述经验属性特征和信用属性特征,如图4所示。

通过上述技术方案的运用,本发明提供了一种翻译稿件的匹配的方法, 可以依据此方法建立风险项目推荐译员平台,能够方便快捷对接中大型翻译 公司在线交付平台,为其风险项目推荐合适译员,极大提高其风险项目处理 能力。

以上对本发明实施例所提供的一种翻译行业风险项目通用推荐译员方 法,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进 行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想;同时, 对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及 应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明 实施例的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号