...
【24h】

音声セグメントを考慮したSTRAIGHTスペクトログラムの非負値行列因子分解

机译:考虑语音段的STRAIGHT频谱图的非负矩阵因子分解

获取原文
获取原文并翻译 | 示例

摘要

本稿では,STRAIGHTにおけるスペクトログラムの圧縮のための音声のセグメントに着目した非負値行列因子分解の新しい枠組みを提案する.非負値行列因子分解は,非負値制約を用いて行列を分解する手法であり,初期値の設走手法や制約条件により分解された行列に特徴を持たせることができる.しかし,非負値行列因子分解を例えば一文の音声のスペクトログラム全体に適用した場合,スペクトログラム全体での因子分解の誤差最小化を行うため,音素によってスペクトルのレベルが高い場合,その音素に重みが偏ってしまう.レベルが高いスペクトルはよく近似できるが,レベルが低いスペクトルは重みが偏ってしまうことで最適な値に近似できない可能性がある.そこで,音声セグメントの特徴に基づいてクラスタ化し,クラスタごとに最適な基底スペクトルを定めスペクトログラムをモデル化する.
机译:在本文中,我们提出了一个新的非负矩阵因子分解框架,其重点是在STRAIGHT中用于频谱图压缩的音频片段。非负矩阵因子分解是使用非负约束分解矩阵的方法,并且可以赋予通过初始值设置方法和约束条件分解的矩阵以特征。但是,例如,当将非负矩阵因子分解应用于句子的整个频谱图时,将整个频谱图中的因子分解的误差最小化。它结束了。高光谱可以很好地近似,但是低光谱可能由于权重偏差而无法接近最佳值。因此,基于语音段的特征进行聚类,为每个聚类确定最佳基础频谱,并对声谱图进行建模。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号