首页> 外文期刊>電子情報通信学会技術研究報告 >セグメンタルNMFによる音声分析合成における基底行列圧縮の検討
【24h】

セグメンタルNMFによる音声分析合成における基底行列圧縮の検討

机译:分段NMF在语音分析与合成中的基矩阵压缩研究

获取原文
获取原文并翻译 | 示例
       

摘要

本稿では,セグメント単位の非負値行列因子分解(セグメンタルNMF)を用いた音声分析合成符号化システムを目的とし,セグメンタルNMF によって生成される基底行列をより簡潔に表現する圧縮方法を提案する.非負値制約を用いて行列を分解し,特徴抽出を行う非負値行列因子分解手法を各音素の特徴に基づいてクラスタ化したSTRAIGHT のスペクトル包絡系列に適用し,基底行列を求める.符号化を考えた場合に,従来のSTRAIGHTのスペクトル包絡系列における各基底の次元数が513 次でありメモリ量の大きさが問題となる.STRAIGHT スペクトル包絡系列の基底行列は,非常にスパースであるので,少数のガウス混合分布により近似表現について検討した.%We have proposed an analysis-synthesis method by using non-negative matrix factorization in phoneme-wise speech segments (segmental NMF). In this paper, a concise representation of a matrix of basis functions of STRAIGHT spectral envelopes is proposed to reduce the number of dimensions of the NMF basis functions. Non-negative matrix factorization technique decomposes a matrix of STRAIGHT spectrum envelope sequences into a basis matrix and a weighting matrix, both of which have non-negative elements. The conventional STRAIGHT power spectrum has 513 dimensions, which requires large amount of memory spaces. According to our previous research, the obtained basis matrix for each segmental STRAIGHT spectrum has very sparse components, and it is expected that such a matrix can be represented by simple combinations of some Gaussian mixture distributions. Some preliminary results of the approximation of the basis functions are discussed.
机译:在本文中,我们提出了一种压缩方法,该方法可以更简洁地表达由分段NMF生成的基本矩阵,以用于使用分段非负矩阵分解(分段NMF)的语音分析和合成编码系统。使用非负约束对矩阵进行分解,并基于每个音素的特征对STRAIGHT聚类的频谱包络序列应用特征提取的非负矩阵分解方法,以找到基础矩阵。考虑到编码,传统的STRAIGHT频谱包络序列中的每个基的维数是513,并且存储量成为问题。由于STRAIGHT频谱包络序列的基本矩阵非常稀疏,因此我们使用少量的高斯混合分布来研究近似表达式。我们提出了一种在音素语音段(分段NMF)中使用非负矩阵分解的分析合成方法。本文提出了STRAIGHT频谱包络基本函数矩阵的简洁表示以减少数量NMF基函数的非维数。非负矩阵分解技术将STRAIGHT频谱包络序列的矩阵分解为基本矩阵和权重矩阵,两者均具有非负元素。常规的STRAIGHT功率谱具有513维,其中根据我们先前的研究,为每个分段STRAIGHT光谱获得的基础矩阵具有非常稀疏的成分,并且期望这种矩阵可以通过一些高斯混合分布的简单组合来表示。讨论了基本函数的近似值。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号