公开/公告号CN1870133A
专利类型发明专利
公开/公告日2006-11-29
原文格式PDF
申请/专利权人 北京大学科技开发部;
申请/专利号CN200510011780.0
申请日2005-05-24
分类号G10L21/02(20060101);G10L21/04(20060101);G10L19/00(20060101);H04R25/00(20060101);
代理机构北京君尚知识产权代理事务所;
代理人俞达成
地址 100871 北京市海淀区颐和园路5号
入库时间 2023-12-17 17:59:48
法律状态公告日
法律状态信息
法律状态
2019-05-07
未缴年费专利权终止 IPC(主分类):G10L21/02 授权公告日:20081203 终止日期:20180524 申请日:20050524
专利权的终止
2008-12-03
授权
授权
2007-01-24
实质审查的生效
实质审查的生效
2006-11-29
公开
公开
技术领域
本发明属于语音信号处理技术领域,涉及一种数字助听器的语音处理方法,具体涉及用于治疗高频听力严重损失的数字助听器语音处理方法。
背景技术
言语交流是人类社会的基本交流方式,也是个人基本生活能力之一。然而对于那些耳聋患者,由于听力下降而导致的言语交流障碍严重影响了他们的生活质量。这不仅给其本人和家庭带来了巨大的痛苦,同时也给整个社会增加了负担。根据中国残疾人联合会2002年2月7日公布的一项统计表明,我国有听力言语障碍的残疾人2057万,占全国6000万残疾人总数的34.3%。另外,由于遗传、药物、感染、噪声、意外事故等原因,每年还会新增聋儿3万名。如此众多的听障人群以及他们的生活痛苦,促使着相关领域的工作者去尽一份努力来帮助这些聋人重新回到有声世界,像正常人一样生活,以此来体现我们和谐社会的人文关爱。
在对感音神经性耳聋患者的治疗方案中,佩戴助听器是一种常用的治疗手段。这种方法适用于听力受损但仍具有残余听力的耳聋患者。听力受损人士相对于正常人的一个主要特征是听阈明显上升,痛阈变化不大,因而整个听力范围变窄;另一个主要特征是在不同频率处听力损失程度不同。当前在临床上广泛使用的数字助听器所采用的频响补偿技术正是为了解决上述问题而提出的。频响补偿技术能够根据病人在各个频率上的听力损失程度,分别对各个频带的语音信号进行动态范围压缩,将正常人可听到的声音信号放大到患者的听力范围之内,从而使患者能够恢复正常听力。
但有研究认为当高频听力损失大于60dB时,放大这些频段的声音不但不能改善言语的识别,反而会产生负面效果。为了解决这一问题一种新的频移助听器方法被提出,这种助听器将语音的频带范围压缩到听障患者的残余听力频带范围内,使得患者能够利用残余的低频听力感受到高频段的语音信息,以增强对语音的可懂度。
本发明正是基于这种新的助听策略,提出了一种新的助听器频带压缩方法,以解决高频听力严重损失患者的听力恢复问题。
发明内容
本发明中所提出的数字助听器语音频率压缩方法通过对信号的短时频谱系数进行处理,将宽带语音信号压缩为窄带语音信号。
根据本发明的数字助听器语音频率压缩方法,主要包括以下技术:
1)进行时频域的转换;本发明中采用加窗傅氏变换的方法。
2)通过信号对数谱的斜率来判断语音信号的能量分布,并动态地调整语音频谱。将信号的对数谱与一段斜率为1的线段作内积,内积结果即为对数谱的斜率。如果斜率小于某一预定门限,说明该帧信号的能量主要分布在低频,通常为语音的浊音段,则采用低通滤波的方法;反之,对高频能量较高的信号帧,通常为语音的清音段,采用频谱包络压缩的方法。
3)通过去除高频谱系数的方法,实现低通滤波。
4)通过频谱包络调整的方法,压缩语音频带。首先利用线性预测分析求出短时信号的谱包络,并将其从原频谱中去除,得到白化谱。再将宽带包络压缩为窄带包络,并对白化谱的低频段谱线进行调制,同时将高频谱去除。
上述技术方案的优点在于只通过调整信号频谱包络来压缩信号带宽,这种方法相当于对信号进行线性处理,避免了非线性频移方法给语音信号带来的听觉失真,而动态的频谱调整又能尽量地保证语音的低频段信息不受破坏,因此利用该方案能够产生高质量的清晰语音。
附图说明
下面结合附图对本发明进一步详细地说明:
图1是频率压缩方法的实现流程图;
图2是压缩前后的语音时频图对比,其中
图2a是原语音信号的时频图;
图2b是压缩后的语音信号时频图。
具体实施方式
下面参照本发明的附图,更详细地描述本发明的最佳实施例。
以下结合实例介绍本发明所提出的数字助听器频率压缩方法,该方法的实现流程如图1所示。所输入的信号为16bit量化16000Hz采样率的语音信号,信号带宽8000Hz,输出信号带宽为2000Hz,采样率及量化精度不变。具体实现步骤如下:
1.时频变换
利用加汉宁窗傅氏变换方法将一帧短时信号(512个样点)转换到频域。并通过傅氏变换系数Xi,进一步得到信号的功率谱。
2.求频谱斜率,并动态地调整语音频谱
对短时信号的功率谱取对数,得到对数谱Pi,然后与斜率为1长度为语音频谱带宽的线段Li作内积,以内积结果作为该帧信号的频谱斜率λ。其中:
Li=i-128 0≤i≤256
当λ小于预定门限th时,信号的能量主要集中在低频段,需要对信号进行低通滤波;当λ大于th时,信号的能量在高频段分布较多,需要对信号频谱进行压缩。
3.频谱处理
根据上一步的判断结果,对信号进行低通滤波或频谱压缩处理。
低通滤波:将信号的复频谱中高频段内的系数置为零,低频段保持不变,用公式表达如下:
频谱包络压缩:
(1)对当前短时帧信号进行线性预测分析,并通过线性预测系数得到信号的谱包络Ei。
(2)将信号的傅氏变换系数除以相应的频谱包络值,即得到去包络后的频谱,或称白化谱Wi。
Wi=Xi/Ei
(3)将频谱包络按压缩比例压缩为窄带包络,简单的实现方法是每隔4个频谱抽取一个包络值,即:
Ei′=E4*i 0≤i<64
(4)将压缩后的窄带包络乘以白化谱系数,并将高频段谱系数置为零,得到压缩后的语音频谱Yi
4.时域恢复
将处理后的频谱系数Yi经反傅氏变换恢复到时域,加汉宁窗后与以前结果进行混叠相加。帧移1/4帧长后继续第一步操作,处理下一帧信号。
附图2是处理前后的语音信号时频图。从图中可以看到,处理后的语音频带被限制在了2000Hz以内。对于浊音信号,频谱只是被滤去了高频段,而对清音信号,频谱则明显地被成比例地压缩了。
尽管为说明目的公开了本发明的具体实施例和附图,其目的在于帮助理解本发明的内容并据以实施,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是可能的。因此,本发明不应局限于最佳实施例和附图所公开的内容。
机译: 助听器输入信号的频率压缩方法及助听器
机译: 助听器输入信号的频率压缩方法及助听器
机译: 助听器(即耳后助听器)的语音控制方法涉及交互语音识别和独特的语音检测,从而将助听器佩戴者说出的语音命令用于语音控制助听器