...
首页> 外文期刊>電子情報通信学会論文誌 >音声認識におけるモデル間スケーリング係数の自動推定
【24h】

音声認識におけるモデル間スケーリング係数の自動推定

机译:语音识别中模型间比例因子的自动估计

获取原文
获取原文并翻译 | 示例

摘要

音声認識における確率モデル間のスケーリング係数を効率的に推定する枠組みを提案する.音声認 識システムは音響モデル,言語モデルなどの複数のモデルで構成される.モデルごとの出力値の乗算を行う際に,出力確率値の各々を異なる指数(スケーリング係数)でべき乗した上で行うと性能が向上することが経験的に知られている.従来,このスケーリング係数は,その値を変化させて対象の音声データを認識する処理を繰り返し,認識率が高くなる点を選択するという,アドホックな方法で最適化されてきた.本論文では,このスケーリング係数を,対数線形モデルの重みパラメータとみなし,最小単語誤り基準を用いて推定する方法を提案する.提案手法では計算量を低減するために単語ラティスを導入するが,それにより生じる推定値の初期値への依存性を軽減するために,単語ラティス生成とこう配法を用いた係数推定とを交互に繰り返し行う.日本語話し言葉コーパスを用いて評価を行い,提案手法が,最も単語正解精度が高くなるスケーリング係数を初期値に依存せず推定することを確認した.
机译:我们提出了一个框架,可以有效地估计语音识别中概率模型之间的比例因子。语音识别系统由多个模型组成,例如声学模型和语言模型。根据经验已知,当将每个模型的输出值相乘时,如果将每个输出概率值提高到具有不同指数(缩放系数)的幂,则性能会得到改善。常规上,已经通过改变值并重复识别目标语音数据的处理以选择具有高识别率的点的自组织方法来优化该缩放系数。在本文中,我们提出了一种使用最小单词错误准则来估计此缩放系数的方法,将其视为对数线性模型的权重参数。在提出的方法中,引入了词格以降低计算复杂度,但是为了减少估计值对初始值的依赖性,交替使用梯度法进行词格生成和系数估计。重复。我们使用日语口语语料库进行了评估,并证实了所提出的方法以最高的单词准确度估计缩放因子,而与初始值无关。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号