要解决的问题:提供一种用于双语单词对齐的方法和装置以及用于训练双语单词对齐模型的方法和装置。
解决方案:双语单词对齐的方法包括:使用单词对齐的标记双语语料库训练双语单词对齐模型;使用双语单词对齐模型对未标记的双语语料库中的多个双语句子对进行单词对齐;确定所述多个双语句子对中的每一个的单词对齐是否正确;如果是正确的,则将双语句子对添加到标记的双语语料库中,并从未标记的双语语料库中删除双语句子对;使用扩展的标记双语语料库重新训练双语单词对齐模型;然后使用重新训练的双语单词对齐模型,对未标记的双语语料库中的其余双语句子对进行单词对齐。
版权:(C)2007,日本特许厅&INPIT
公开/公告号JP2007234024A
专利类型
公开/公告日2007-09-13
原文格式PDF
申请/专利权人 TOSHIBA CORP;
申请/专利号JP20070048894
申请日2007-02-28
分类号G06F17/28;
国家 JP
入库时间 2022-08-21 21:16:06