首页> 外文期刊>電子情報通信学会技術研究報告 >ステレオ符号化が仮想3次元空間音声の音像定位精度に与える影響
【24h】

ステレオ符号化が仮想3次元空間音声の音像定位精度に与える影響

机译:立体编码对虚拟3D空间语音声像定位精度的影响

获取原文
获取原文并翻译 | 示例
       

摘要

本研究では,音像定位を用いて話者分離を行う音声会議システムにおいて,定位音声の伝送におけるステレオ符号化の影響を比較検討した.伝送符号化方式にはMP3によるMSステレオ方式とHE-AACによるパラメトリックステレオ方式(aacPlusv2)を用い,同-データレートで比較を行った.音像定位音声のMUSHRA主観評価を行い,パラメトリックステレオ方式が20ポイント前後MSステレオ方式より良い結果が得られた.しかし音像定位精度に対しては,符号化方式問およびそのデータレート間に有意差は無く,さらに符号化しない場合よりも水平面上の方位角左右15°~60° の間で音像定位精度が高くなることが分かった.%In this paper, we investigated the influence of stereo coding on the 3D sound localization accuracy. We used the MP3 Mid-Side Stereo encoder and the HE-AAC (aacPlus v2) Parametric Stereo encoder at identical data rates. First, the sound quality of the localized speech signal was checked using MUSHRA subjective tests. The result showed that the quality for HE-AAC is higher than MP3 by 20 points. Next, the sound localization accuracy was estimated, but statistically significant difference was not shown for the encoder nor for the data rate. Moreover, we found that the sound localization accuracy becomes higher than the original non-encoded speech signal between azimuth ranges of + 15 to 60 and -15 to -60 degrees.
机译:在本研究中,我们比较了立体声编码对通过声音图像定位将扬声器分离的语音会议系统中本地音频传输的影响,传输编码方法是MP3和HE-AAC的MS立体声方法。使用参数立体声方法(aacPlusv2)并以相同的数据速率进行比较,对声音定位声音进行MUSHRA主观评估,参数立体声方法比MS立体声方法在20点左右的效果更好。关于精度,编码方法及其数据率之间没有显着差异,并且在15°至60°的水平方位角之间的声像定位精度可能比没有编码的情况高。 %在本文中,我们研究了立体声编码对3D声音定位精度的影响。我们以相同的数据速率使用了MP3中侧立体声编码器和HE-AAC(aacPlus v2)参数立体声编码器。结果表明,HE-AAC的质量比MP3高20点。接下来,估计了声音的定位精度,但使用MUSHRA主观测试检查了本地化语音信号的声音质量,未显示出统计学上的显着差异。此外,我们发现,在+ 15至60的方位角范围内,声音的定位精度高于原始的未编码语音信号。 -15至-60度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号