首页> 外文OA文献 >Measurements in Perceptual Annoyance of Audio Coding Artifacts
【2h】

Measurements in Perceptual Annoyance of Audio Coding Artifacts

机译:音频编码伪像的感知烦恼度的测量

摘要

Tässä diplomityössä tutkitaan matalan bittinopeuden puhe- ja audiokooderin USACin kehityksessä merkittäväksi koettujen koodausartifaktien psykoakustista ärsyttävyyttä. Tutkielmassa käsitellään neljää ilmiötä, jotka on eritelty alempana. Artifaktit mallinnettiin MATLAB(R)-ohjelmistolla ja niiden ärsyttävyyttä arvioitiin kuuntelukokein. Työn toimeksiantaja on saksalainen Fraunhofer-instituutti, joka tunnetaan muun muassa MP3-koodekin kehittäjänä.Audionkoodauksessa signaaleja käsitellään yleensä noin 20-50 millisekunnin pituisina kehyksinä, jolloin koodausartifaktit voivat vaihdella nopeastikin. Tämän ilmiön ärsyttävyyttä tutkittiin varioimalla kapeakaistaisen kohinan sekä yksittäisten harmonisten voimakkuutta eri nopeuksilla. Koetulosten perusteella keskinopea vaihtelu koetaan ärsyttävimmäksi.Harmoninen kaistanleveyden laajennus (harmonic bandwidth extension) on menetelmä, jolla voidaan luoda harmonisia komponentteja rajataajuuden yläpuolelle alkuperäistä spektriä venyttämällä. Näin audiosignaalin bittinopeutta voidaan laskea, kun ylimpiä harmonisia ei tarvitse koodata eksplisiittisesti, vaan ne voidaan generoida dekoodauksessa. Koska luotujen harmonisisten joukko on kuitenkin aina puutteellinen, saattaa syntyä vaikutelma ylimääräisestä sävelkorkeudesta (ghost pitch). Kuuntelukokeessa tutkittiin synteettisillä äänillä, miten tämän ilmiön voimakkuus riippuu äänen perustaajuudesta ja valitusta rajataajuudesta.Kuulon peittokäyrää voidaan approksimoida tehokkaasti spektrin verhokäyrällä, jota käyttäen itse signaalikehys voidaan siirtää perkeptuaaliseen alueeseen kvantisoitavaksi. Kvantisointikohinan peittymistä voidaan tehostaa säätämällä verhokäyrän pehmeyttä sen siirtofunktioon sijoitetulla vakiolla. Työssä esitetään ehdotus tämän parametrin arvoksi.Sopivasti muokattua verhokäyrää voidaan käyttää myös spektrin voimakkaiden osien vahvistamiseen ja heikkojen osien vaimentamiseen. Puhesignaaleilla huomattiin, että tällä formanttien korostamisella voidaan peittää kvantisointikohinaa, mutta samalla sointiväri muuttuu epäluonnollisemmaksi. Tekstissä esitetään malli optimaalisten muokkausvakioiden valitsemiseksi perkeptuaalisen signaali-kohinasuhteen funktiona.
机译:本文研究了在低比特率语音和音频编码器USAC的发展中被认为重要的编码伪像的心理声学烦恼。论文主要研究了以下四种现象。使用MATLAB(R)软件对伪影进行建模,并通过收听实验评估其易怒性。这项工作是由德国弗劳恩霍夫研究所(Fraunhofer Institute)委托进行的,该研究所除其他外还被称为MP3编解码器的开发者。通过改变窄带噪声的强度以及不同速率下的单个谐波来研究这种现象的易怒性。根据测试结果,中速变化是最令人讨厌的,谐波带宽扩展是一种通过扩展原始频谱在截止频率以上产生谐波分量的方法。这样,当不需要明确编码最高谐波时,可以计算音频信号的比特率,但是可以在解码时生成音频信号的比特率。但是,由于创建的谐波组总是不完整,因此可能会产生额外音调(Ghost音调)的印象。听力实验使用合成音调研究了这种现象的强度如何取决于声音的基频和所选的截止频率。可以通过在包络的传递函数中设置一个常数来调整包络的软度,从而增强量化噪声的覆盖范围。该参数的值是在工作中提出的,也可以使用适当修改的包络来放大频谱的强部分并衰减弱部分。通过语音信号观察到,对共振峰的这种强调可以掩盖量化噪声,但是与此同时,音色变得更加不自然。本文介绍了一个模型,用于根据感知信噪比选择最佳成形常数。

著录项

  • 作者

    Paunonen Lari;

  • 作者单位
  • 年度 2013
  • 总页数
  • 原文格式 PDF
  • 正文语种 en
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号