入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補

福井　勝宏; 堤　公孝; 佐々木茂明; 日和崎祐介; 羽田　陽一

首页> 外文期刊>電子情報通信学会技術研究報告 >入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補

【24h】

入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補

机译：根据输入频谱的稀疏性组合编码模式的多级语音编码方法：ITU-T G.722 / G.711.1超宽带扩展标准化候选

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿では，ITU-T G.722/G.711.1 Super Wideband拡張の標準化におけるqualificationフェーズ時にNTT含むコンソーシアムから提出された，スケーラブル符号化方式の8-14kHz帯域レイヤに関わる音声符号化手法について詳述する．本手法は，MDCT係数の量子化において，音声や楽音など様々な音源の特性に応じて最適な符号化方式を4つのモードから選択して用いる多段量子化手法で，音源に関わらず高音質を実現する．本手法により，全ての条件でリファレンスコーデックの音質を上回り，音声品質に関する標準化要求条件を満たすことを主観評価により示した．%This paper describes a coding algorithm for 8-14 kHz bandwith layer of a scalable speech codec, submitted by a consortium including NTT as a candidate in the qualification phase of ITU-T G.722/G.711.1 super wideband extension standardization. The candidate codec achieves high speech quality irrespective of the sound source by using the proposed multistage quantization in the MDCT domain that selects the best encoding scheme among four modes according to the characteristic of various sound sources. The subjective test results showed that the candidate codec obtained higher scores than the reference codec in all samples and passed all requirements of the standardization in listening quality.

机译：本文详细介绍了在ITU-T G.722 / G.711.1超宽带扩展的标准化阶段，包括NTT在内的财团提交的与可扩展编码方法的8-14kHz频带层有关的语音编码方法。。该方法是一种多级量化方法，根据MDCT系数量化中各种声音源（例如声音和音乐声）的特性，从四种模式中选择和使用最佳编码方法。实现。主观评估表明，该方法在所有条件下均超过了参考编解码器的声音质量，并满足了语音质量的标准化要求。％本文介绍了由NTT作为财团在ITU-T G.722 / G.711.1超宽带扩展标准化阶段的候选者提交的可伸缩语音编解码器8-14 kHz带层编码算法。通过在MDCT域中使用建议的多级量化，该候选编解码器在不考虑声源的情况下都能获得较高的语音质量，该MDCT根据各种声源的特性在四种模式中选择最佳的编码方案。主观测试结果表明，候选编解码器获得了更高的语音质量在所有样本中得分均比参考编解码器高，并且通过了收听质量标准化的所有要求。

著录项

来源
《電子情報通信学会技術研究報告》 |2010年第373期|p.279-284|共6页
作者
福井　勝宏; 堤　公孝; 佐々木茂明; 日和崎祐介; 羽田　陽一;
展开▼
作者单位

日本電信電話株式会社　NTTサイバースペース研究所　〒180-8585東京都武蔵野市緑町3-9-11;

日本電信電話株式会社　NTTサイバースペース研究所　〒180-8585東京都武蔵野市緑町3-9-11;

日本電信電話株式会社　NTTサイバースペース研究所　〒180-8585東京都武蔵野市緑町3-9-11;

日本電信電話株式会社　NTTサイバースペース研究所　〒180-8585東京都武蔵野市緑町3-9-11;

日本電信電話株式会社　NTTサイバースペース研究所　〒180-8585東京都武蔵野市緑町3-9-11;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
14kHz帯域音声符号化; スケーラブル符号化; ベクトル量子化; ITU-T G.722; ITU-T G.711.1;

机译：14kHz频带语音编码;可伸缩编码;矢量量化;ITU-T G.722;ITU-T G.711.1;
入库时间 2022-08-18 00:32:04

相似文献

外文文献
专利

1. 入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補 [J] . 福井　勝宏, 堤　公孝, 佐々木茂明, 電子情報通信学会技術研究報告 . 2010,第375期

机译：根据输入频谱的稀疏性组合编码模式的多级语音编码方法：ITU-T G.722 / G.711.1超宽带扩展标准化候选
2. 入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補 [J] . 福井　勝宏, 堤　公孝, 佐々木茂明, 電子情報通信学会技術研究報告 . 2010,第374期

机译：根据输入频谱的稀疏性组合编码模式的多级语音编码方法：ITU-T G.722 / G.711.1超宽带扩展标准化候选
3. 入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1 Super Wideband Extension標準化候補 [J] . 福井　勝宏, 堤　公孝, 佐々木茂明, 電子情報通信学会技術研究報告 . 2010,第376期

机译：根据输入频谱的稀疏性组合编码模式的多级语音编码方法：ITU-T G.722 / G.711.1超宽带扩展标准化候选
4. 同調粘性マスダンパー付き多層せh断型構造物におけるスペクトルモーダルアナリシスの適用性その3 ダンパー力に関する実用的応答評価法の改善 [C] . 上條祐人, 池永昌容, 渡邊一矩, 日本建築学会大会;日本建築学会 . 2013

机译：光谱模态分析在具有同步粘性阻尼器的多层结构中的适用性第3部分阻尼力实用响应评估方法的改进
5. 線スペクトルパラメータによる音声符号化に関する研究 [D] . 管村, 昇 1985

机译：线谱参数语音编码研究
6. アルカリフォスファターゼ結合オリゴヌクレオチドプローブを用いたin situハイブリダイゼーションによるホルボールエスデル及び抗体により活性化させた細胞株とnull細胞株のEpstein-Barrウイルスの転写産物の検出 [O] . 弘中孝史, ヒロナカタカシ 2017

机译：通过与碱性磷酸酶偶联的寡核苷酸探针进行原位杂交，检测佛波醇，抗体激活和无效细胞系中的爱泼斯坦-巴尔病毒转录本

入力スペクトルのスパース性に応じた符号化モード組合せ多段音声符号化手法: ITU-TG.722/G.711.1Super Wideband Extension標準化候補

摘要

著录项

相似文献

相关主题

期刊订阅