【24h】

音声翻訳単位の推定における句読点情報の効果

机译:标点符号信息对语音翻译单元估计的影响

获取原文
获取原文并翻译 | 示例
           

摘要

文の区切りが明確でない,一文が長くなる,文の途中に間(ポーズ)が空くなどの現象が見られる自然な話し言葉を,適切な単位に区分化する処理が求められている.筆者らは,区分化の単位として従来用いられている文や節に代わる,プロの同時通訳者が原言語からターゲット言語に変換する自然なタイミングである音声翻訳単位を提案し,同単位の特徴と,言語情報ならびに韻律情報とSVMチャンカ用いた音声翻訳単位境界の推定手法について検討を行ってきた.一方,書き言葉では,区分化の単位として,句読点が広く用いられている.本稿では,音声翻訳単位境界と句読点との関連性と,プロの通訳者が付与した音声翻訳単位境界情報と句読点情報の双方を用いた場合の音声翻訳単位境界推定への効果について述べる.日本語話し言葉コーパス(CSJ)を用いた実験おいて,句読点既知データの場合F値0.88,句読点未知データの場合F値0.86と,プロの通訳者によるF値0.84に相当する性能を達成した.
机译:需要将自然口语单词划分为适当的单元,该自然口语单词具有诸如不清楚的句子间断,冗长的句子和句子中间的间隙的现象。作者提出了语音翻译单元,这是专业同声传译员从原始语言转换为目标语言的自然时机,而不是通常用作分隔单元的句子和从句。我们还研究了一种使用语言信息,押韵信息和SVM分块器估计语音翻译单元边界的方法。另一方面,在书面语中,标点符号被广泛用作划分的单位。本文介绍了语音翻译单元边界与标点符号之间的关系,以及同时使用专业口译员提供的语音翻译单元边界信息和标点信息对语音翻译单元边界估计的影响。在使用日语口语语料库(CSJ)进行的实验中,我们获得的性能相当于标点已知的数据的F值为0.88,标点未知的数据的F值为0.86,相当于专业口译员的F值为0.84。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号