首页> 外国专利> METHOD AND APPARATUS FOR BILINGUAL WORD ALIGNMENT, METHOD AND APPARATUS FOR TRAINING BILINGUAL WORD ALIGNMENT MODEL

METHOD AND APPARATUS FOR BILINGUAL WORD ALIGNMENT, METHOD AND APPARATUS FOR TRAINING BILINGUAL WORD ALIGNMENT MODEL

机译:双语单词对齐的方法和装置,训练双语单词对齐模型的方法和装置

摘要

PPROBLEM TO BE SOLVED: To provide a method and apparatus for bilingual word alignment and a method and apparatus for training a bilingual word alignment model. PSOLUTION: The method for bilingual word alignment comprises: training the bilingual word alignment model using a word-aligned labeled bilingual corpus; word-aligning a plurality of bilingual sentence pairs in unlabeled bilingual corpus using the bilingual word alignment model; determining whether the word alignment of each of the plurality of bilingual sentence pairs is correct; and if it is correct, adding the bilingual sentence pair into the labeled bilingual corpus and removing the bilingual sentence pair from the unlabeled bilingual corpus; retraining the bilingual word alignment model using the expanded labeled bilingual corpus; and re-word-aligning the remaining bilingual sentence pairs in the unlabeled bilingual corpus using the retrained bilingual word alignment model. PCOPYRIGHT: (C)2007,JPO&INPIT
机译:

要解决的问题:提供一种用于双语单词对齐的方法和装置以及用于训练双语单词对齐模型的方法和装置。

解决方案:双语单词对齐的方法包括:使用单词对齐的标记双语语料库训练双语单词对齐模型;使用双语单词对齐模型对未标记的双语语料库中的多个双语句子对进行单词对齐;确定所述多个双语句子对中的每一个的单词对齐是否正确;如果是正确的,则将双语句子对添加到标记的双语语料库中,并从未标记的双语语料库中删除双语句子对;使用扩展的标记双语语料库重新训练双语单词对齐模型;然后使用重新训练的双语单词对齐模型,对未标记的双语语料库中的其余双语句子对进行单词对齐。

版权:(C)2007,日本特许厅&INPIT

著录项

  • 公开/公告号JP2007234024A

    专利类型

  • 公开/公告日2007-09-13

    原文格式PDF

  • 申请/专利权人 TOSHIBA CORP;

    申请/专利号JP20070048894

  • 发明设计人 WU HUA;WAN HAIFEN;LIU ZHANYI;

    申请日2007-02-28

  • 分类号G06F17/28;

  • 国家 JP

  • 入库时间 2022-08-21 21:16:06

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号