要解决的问题:从文档数据库自动获取一组翻译规则。
解决方案:准备该翻译规则提取程序以使计算机作为从并行语料库中提取一组翻译规则的设备来进行操作,并且该设备包括同义词句子形成部分110,该同义词句子形成部分110用于从计算机系统中形成同义词句子集合。并行语料库,用于从每个同义句子集合中提取同义表达对的同义表达对提取部分112,以及用于将提取的同义表达对分类为同义表达簇的分类部分116,并创建一组翻译规则,其中每个同义表达簇被用作翻译规则。所述设备可以包括:代表表达决定部分118,用于确定所述翻译规则组中的每一个的代表同义表达;以及处理部分114,用于基于出现频率或同现关系来过滤所提取的同义表达对。
版权:(C)2004,日本特许厅
公开/公告号JP2003323426A
专利类型
公开/公告日2003-11-14
原文格式PDF
申请/专利号JP20020132764
申请日2002-05-08
分类号G06F17/28;G06F17/30;
国家 JP
入库时间 2022-08-21 23:27:41