首页> 中国专利> 特殊语言现象处理技术

特殊语言现象处理技术

摘要

本发明技术的步骤为:在字典中建立特殊语言现象规则;分析过程中,首先在字典中查找句子中的每个单词,并将各单词下的所有特殊语言现象规则检索出来;对句子进行归约时,若当前单词下有特殊语言现象规则,则首先对与该单词有关的特殊语言现象进行归约。本发明在词典中加入特殊语言现象信息,这样作不仅符合人们的思维习惯,而且便于翻译处理机制查找,便于分散处理和增强区分多义的能力,还可提高特殊语言现象的处理效率。

著录项

  • 公开/公告号CN1172993A

    专利类型发明专利

  • 公开/公告日1998-02-11

    原文格式PDF

  • 申请/专利权人 陈肇雄;

    申请/专利号CN97112502.3

  • 发明设计人 陈肇雄;

    申请日1997-07-02

  • 分类号G06F17/28;

  • 代理机构北京市专利事务所;

  • 代理人张卫华

  • 地址 100080 北京市2704信箱

  • 入库时间 2023-12-17 13:04:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-22

    未缴年费专利权终止 IPC(主分类):G06F17/28 授权公告日:20010627 终止日期:20160702 申请日:19970702

    专利权的终止

  • 2009-05-27

    专利申请权、专利权的转移(专利权的转移) 变更前: 变更后: 登记生效日:20090417 申请日:19970702

    专利申请权、专利权的转移(专利权的转移)

  • 2001-06-27

    授权

    授权

  • 2000-05-10

    著录项目变更 变更前: 变更后: 申请日:19970702

    著录项目变更

  • 1998-04-29

    实质审查请求的生效

    实质审查请求的生效

  • 1998-02-11

    公开

    公开

查看全部

说明书

本发明涉及机器翻译中的特殊语言现象处理技术,属于机器翻译技术领域。

特殊语言现象指成语、固定结构等。机译系统对特殊语言现象处理能力的强弱是衡量其性能好坏的标志之一。有些机译系统采取单独设立特殊语言现象词典的方法,其结果是不仅难以查找,而且也不便于总结归纳。

本发明的目的旨在提供一种特殊语言现象处理技术,该技术符合人们的思维习惯,便于翻译处理机制查找,可提高特殊语言现象的处理效率。

本发明是通过如下方法实现的:

一种使用计算机进行的特殊语言现象处理技术,其步骤为:

(一)在字典中建立特殊语言现象规则

规则的形式为:<头部>-><上下文相关函数>,<右部>,<转换体>

其中<头部>由构成该特殊语言现象的单词或句子成分组成,<上下文相关函数>部分标明该特殊语言现象应用的上下文语境要求,<右部>指明特殊语言现象的语法及语义等特征信息,<转换体>对应于特殊语言现象的译文;

(二)翻译处理机制在分析过程中,首先在字典中查找句子中的每个单词,并将各单词下的所有特殊语言现象规则检索出来;

(三)对句子进行归约时,若当前归约单词下有特殊语言现象规则,则首先对与该单词有关的特殊语言现象进行归约;

(四)翻译处理算法接收一句子时,对句中与每一个单词有关的特殊语言现象进行如下处理:

(1)对当前单词下的每一条特殊语言现象规则与原句进行匹配,直至有一条规则匹配成功或全部规则匹配完毕时本算法结束。

(2)对每一条特殊语言现象规则,若其头部均为单词,则只需用该规则直接与原句进行匹配,并判定上下文相关条件是否成立即可;若当前特殊语言现象规则头部含有句子成分,则需要首先对单词部分进行直接进行匹配,匹配成功后再调用翻译处理算法对句子中对应部分进行归约,看归约结果与特殊语言现象规则头部的成分是否能匹配成功。头部匹配成功后,再判定上下文相关条件是否成立。

本发明在词典中加入特殊语言现象信息,即把与具体单词有关的特殊语言现象以规则形式直接存储在特殊语言现象中的主要单词的词条下,这样作不仅符合人们的思维习惯,而且便于翻译处理机制查找,便于分散处理和增强区分多义的能力,还可提高特殊语言现象的处理效率。

以下结合附图和发明实例对本发明作详细描述。

图1是本发明算法流程图。

本发明是使用普通计算机实现的,其步骤为:

一、在字典中建立特殊语言现象规则

字典中的特殊语言现象等价于一条规则。规则的形式为:

<头部>-><上下文相关函数>,<右部>,<转换体>

其中<头部>由构成该特殊语言现象的单词或句子成分组成,<上下文相关函数>部分标明该特殊语言现象应用的上下文语境要求,<右部>指明特殊语言现象的语法及语义等特征信息,<转换体>对应于特殊语言现象的译文。

同一个特殊语言现象,如果对应于若干个不同的译文,在词典中就表示为若干个不同的特殊规则。

二、翻译处理机制在分析过程中,首先在字典中查找句子中的每个单词,并将各单词下的所有特殊语言现象规则检索出来。

三、对句子进行归约时,若当前单词下有特殊语言现象规则,则首先对与该单词有关的特殊语言现象进行归约。

四、翻译处理算法接收一句子时,对句中与每一个单词有关的特殊语言现象进行处理的具体算法如下(参见图1,图中将特殊语言现象规则简称为规则):

1.置当前特殊语言现象规则下标为0。

2.当前特殊语言现象下标加1,即置当前特殊语言现象规则为下一条特殊语言现象规则。若当前特殊语言现象规则下标对应特殊语言现象规则为空,则当前单词对应特殊语言现象规则匹配失败结束。

3.若当前特殊语言现象规则头部均为单词,则用该规则直接进行匹配,若头部匹配失败,则当前规则失败,转步骤2;若头部匹配成功,则调用上下文相关处理算法判定上下文相关测试条件,若条件成立,则直接对该特殊语言现象进行归约,本过程成功结束;若条件不成立,转步骤2。若当前特殊语言现象规则头部含有句子成分(即非单词),则转步骤4。

4.若当前特殊语言现象规则头部含有句子成分,则先将单词部分进行匹配,匹配失败,转步骤2,否则对句子中对应部分进行归约,若归约结果与特殊语言现象规则头部的句子成分不一致,则当前规则匹配失败,转步骤2;否则,调用上下文相关处理算法判定上下文测试条件,若条件成立,则可对该特殊语言现象进行归约,本过程成功结束;若条件不成立,转步骤2。

下面举例说明本发明。

将句子“They put that question into account.”翻译为中文。

现有字典:

词条1:they      NP  他们

词条2:put       VP  放

词条3:put NP into account->,VP,把NP考虑进去.

词条4:that      Q   那个

词条5:question  NP  问题

现有规则:

规则1:Q NP->,NP,Q NP.

规则2:NP VP->,S,NP VP.

其中,词条3为成语。

对句子归约过程:

(1)用词条1将they归约为NP;

(2)对put进行归约时,由于put下有成语,首先匹配该成语。成语中的put...into account与句子中的对应单词可匹配。然后看that qustion是否能归约为短语中的NP。

(3)用词条4将that归约为Q。

(4)用词条5将question归约为NP。

(5)用规则1将Q NP归约为NP,与短语中的句子成分一致。因此,put NPinto account成语匹配成功。用词条3将其归约为VP。对句子的第一次归约结果为NP VP。

(6)用规则2将NP VP归约为S,句子归约成功。

最终译文为“他们把那个问题考虑进去了”。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号