【24h】

日英単言語Webコーパスからの対訳treebank自動獲得

机译:日本 - 英语单语言Web语料库来自Corpus TreeBank自动采集

获取原文
获取原文并翻译 | 示例
       

摘要

大規模な日本語と英語の単言語Webコーパスから,動詞を含む頻出部分構文木を探索して対訳辞書を用いて対応付けし,対訳の部分構文木(対訳treebank)を幅広く獲得する手法を提案する.提案手法を用いた実験で,日本語36億文,英語15億文の単言語Webコーパスから動詞と目的語を含む対訳の頻出部分構文木を幅広く獲得した.療得した対訳を利用した機械翻訳の実験により,NTT機械翻訳機能試験文の翻訳において自動獲得した対訳の有効性が確認された.
机译:从大规模日语和英语单级Web语料库中,我们提出了一种搜索频繁部分语法树的方法,包括口头字典,并使用双语词典,并提出一种获取广泛范围的方法。 在实验中,使用所提出的方法,日语的日语语言,英语15亿句中单语言网上语料库赢得了各种频繁的部分语法树,包括动词和目标。 使用治疗性倾斜的机器翻译实验证实了在NTT机器翻译功能测试句的翻译中自动获得的简单获取的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号