首页> 外文期刊>電子情報通信学会技術研究報告 >入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補
【24h】

入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補

机译:根据输入频谱的稀疏性组合编码模式的多级语音编码方法:ITU-T G.722 / G.711.1超宽带扩展标准化候选

获取原文
获取原文并翻译 | 示例
       

摘要

本稿では,ITU-T G.722/G.711.1 Super Wideband拡張の標準化におけるqualificationフェーズ時にNTT含むコンソーシアムから提出された,スケーラブル符号化方式の8-14kHz帯域レイヤに関わる音声符号化手法について詳述する.本手法は,MDCT係数の量子化において,音声や楽音など様々な音源の特性に応じて最適な符号化方式を4つのモードから選択して用いる多段量子化手法で,音源に関わらず高音質を実現する.本手法により,全ての条件でリファレンスコーデックの音質を上回り,音声品質に関する標準化要求条件を満たすことを主観評価により示した.%This paper describes a coding algorithm for 8-14 kHz bandwith layer of a scalable speech codec, submitted by a consortium including NTT as a candidate in the qualification phase of ITU-T G.722/G.711.1 super wideband extension standardization. The candidate codec achieves high speech quality irrespective of the sound source by using the proposed multistage quantization in the MDCT domain that selects the best encoding scheme among four modes according to the characteristic of various sound sources. The subjective test results showed that the candidate codec obtained higher scores than the reference codec in all samples and passed all requirements of the standardization in listening quality.
机译:本文详细介绍了在ITU-T G.722 / G.711.1超宽带扩展的标准化阶段,包括NTT在内的财团提交的与可扩展编码方法的8-14kHz频带层有关的语音编码方法。 。该方法是一种多级量化方法,根据MDCT系数量化中各种声音源(例如声音和音乐声)的特性,从四种模式中选择和使用最佳编码方法。实现。主观评估表明,该方法在所有条件下均超过了参考编解码器的声音质量,并满足了语音质量的标准化要求。 %本文介绍了由NTT作为财团在ITU-T G.722 / G.711.1超宽带扩展标准化阶段的候选者提交的可伸缩语音编解码器8-14 kHz带层编码算法。通过在MDCT域中使用建议的多级量化,该候选编解码器在不考虑声源的情况下都能获得较高的语音质量,该MDCT根据各种声源的特性在四种模式中选择最佳的编码方案。主观测试结果表明,候选编解码器获得了更高的语音质量在所有样本中得分均比参考编解码器高,并且通过了收听质量标准化的所有要求。

著录项

相似文献

  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号