首页> 中国专利> 人工电子耳蜗以及一种双刺激速率言语处理方法

人工电子耳蜗以及一种双刺激速率言语处理方法

摘要

本发明公开了一种人工电子耳蜗、一种言语处理器以及一种双刺激速率言语处理方法。本发明应用在人工电子耳蜗中,首先对语音信号经预处理、带通滤波、半波整流、低通滤波后获取每个通道的包络幅度,并将电流幅度调整至工作幅度范围;选取包络幅度大于或等于阈值的多个通道组成第一部分(高幅度)通道,对第一部分通道采用第一(高)刺激速率的脉冲序列调制;选取包络幅度小于阈值的多个通道组成第二部分(低幅度)通道,对第二部分通道采用第二(低)刺激速率的脉冲序列调制;采用调制后的第一、第二部分通道的电脉冲序列刺激对应的刺激电极。本发明实现了将所有通道的包络幅度信息传送给人工电子耳蜗患者的目标,有效地提高人工电子耳蜗的言语识别效果。

著录项

  • 公开/公告号CN101773429A

    专利类型发明专利

  • 公开/公告日2010-07-14

    原文格式PDF

  • 申请/专利权人 杭州诺尔康神经电子科技有限公司;

    申请/专利号CN201010000517.2

  • 发明设计人 傅前杰;陈宏斌;李亚杰;

    申请日2010-01-11

  • 分类号A61F11/04(20060101);

  • 代理机构11246 北京众合诚成知识产权代理有限公司;

  • 代理人龚燮英

  • 地址 310011 浙江省杭州市杭州经济技术开发区6号大街5号2幢518室

  • 入库时间 2023-12-18 00:01:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-06-25

    专利权人的姓名或者名称、地址的变更 IPC(主分类):A61F11/04 变更前: 变更后: 申请日:20100111

    专利权人的姓名或者名称、地址的变更

  • 2013-01-23

    著录事项变更 IPC(主分类):A61F11/04 变更前: 变更后: 申请日:20100111

    著录事项变更

  • 2013-01-16

    授权

    授权

  • 2010-09-15

    实质审查的生效 IPC(主分类):A61F11/04 申请日:20100111

    实质审查的生效

  • 2010-07-14

    公开

    公开

说明书

技术领域

本发明涉及助听设备技术领域,尤其涉及一种人工电子耳蜗、一种言语处理器以及一种双刺激速率言语处理方法。

背景技术

人的耳蜗毛细胞是接受声音的感觉细胞。当耳蜗毛细胞损伤严重时,就会出现严重的听力损伤。人工耳蜗就是替代已损伤毛细胞,通过电刺激听觉神经重新获得声音信号的一种电子装置。图1显示的是人工耳蜗的工作模式图。人工耳蜗由体外和体内装置两部分组成,体外部分包括麦克风、言语处理器、发射线圈;体内的部分包括接收线圈、处理器、刺激电极及参照电极组成。

如图2所示,麦克风接受声信号,通过言语处理器,将声信号进行数字编码等处理,通过头件跨皮肤传送到植入人体内的接收线圈,再经过刺激器的解码处理后,产生相应频率及电流强度的脉冲信号并传送到各个刺激电极,通过电极刺激听神经,将脉冲信号传到听觉中枢从而产生听觉。

其中,言语处理器是整个系统最重要的一个组成部分。言语处理器会决定声学信号如何转换成电信号。目前言语处理器采用连续间隔采样处理策略(CIS策略;Wilson et al,1991)或者波谱峰值采样策略(例如SPEAK或者ACE策略)。

连续间隔采样处理策略是目前人工耳蜗系统最常用的言语处理策略之一。使用连续间隔采样处理策略的言语处理器,首先把采集的语音信号通过特定数目的带通滤波器,再使用半波整流以及低通滤波器的方法提取出每个通道的包络幅度;再使用一个非线性函数(例如,对数)将每个通道的包络幅度转换到适合患者电刺激的电流幅度并刺激一个对应的电极。

一般来说,频谱的精度是通过刺激电极的数目来决定的,而时域的精度是通过刺激速率来决定的。越多的刺激电极就可以提供更好的频谱精度,而更快的刺激速率可以提高语音信号的采样率。

使用波谱峰值采样策略的言语处理器,与使用连续间隔采样处理CIS策略的言语处理器一样,使用波谱峰值采样策略的言语处理器,首先把采集的语音信号通过特定数目的带通滤波器(例如SPEAK策略中使用20个),再使用半波整流以及低通滤波器的方法提取出每个通道的包络幅度;再比较所有通道的包络幅度的大小,选择具有最大包络幅度的几个通道(一般6-8个);之后,再把这些选择出的包络幅度用非线性函数转换成适合患者电刺激的电流幅度并刺激相对应的电极。

在人工耳蜗言语处理中,语音包络信号一般是在每一个频段利用半波整流和低通滤波的方法来提取的。在包络提取滤波器的截止频率和刺激速率限制了能传输给植入电极的时间波动信号。许多研究结果表明,缓慢变化的包络信号(小于20赫兹)对人工耳蜗患者以及具有正常听力的听者提供了言语理解最有用的语音信息。最近的研究结果也表明,比较高频(50-500赫兹)的时间波动信号对超音段信息的识别有很重要的作用,特别是讲话者性别识别或者声调识别。

许多研究对人工耳蜗患者的言语理解能力与他们检测时域波动能力进行了比较。结果表明,人工耳蜗患者之间调制检测能力有很大的差异。对一些人工耳蜗患者来说,他们检测幅度调制的能力与具有正常听力的人没有太大的差别。然而对其他一些人工耳蜗患者来说,他们检测幅度调制的能力比具有正常听力的人差很多。

研究结果进一步还显示,人工耳蜗患者在不同的响度下平均的幅度调制检测能力与他们的语音识别能力有非常高的相关性。最近的数据还显示,虽然刺激速率在中等或者比较高的刺激响度下对幅度调制检测并没有太多的影响。但是在比较低的响度下,刺激速率对幅度调制检测阈值有很大的影响。但是在比较低的响度下,人工耳蜗患者在低刺激速率下(例如250赫兹)下的幅度调制检测能力比在高刺激速率下(例如2000赫兹)下的幅度调制检测能力好很多。

因而,上述结果表明,具有较高包络幅度的通道使用高刺激速率可以使患者获取最多的信息(高采样率和较好的幅度调制检测能力)。然而,在包络幅度较小的通道,高刺激速率下所引起的较差幅度调制检测能力使人工耳蜗患者并不能有效地感知高频周期信号或者重要的低幅度包络信号。

在这种情况下,在包络幅度较小的通道,具有较好幅度调制检测能力的较低刺激速率更为可取。这种在幅度调制检测能力的优势也可以让人工耳蜗患者在比较嘈杂的背景噪声下更好地提取相对较弱的时域包络信号(大部分的噪声信号被映射到动态范围的较低部分)。

目前使用的CIS策略和ACE策略具有一定的局限性。

图3所示的是目前使用的CIS处理方法的示意图。对CIS策略来说,所有通道的频谱信息可以有效地传送。缺点是如果总的刺激速率有限(例如20千赫兹),每个通道的刺激速率会偏低(以24通道为例,每个通道的刺激速率是833赫兹)。即使总的刺激速率可以提高,包络幅度较低的通道如果使用与高包络幅度的通道同样的高速率刺激也不是很理想,因为高刺激速率下所引起的较差幅度调制检测能力使人工耳蜗患者并不能有效地感知高频周期信号或者重要的低幅度包络信号。

图4所示的是目前使用的ACE处理方法的示意图。对ACE策略来说,即使是总的刺激速率有限,高包络幅度的通道信息也可以有效地传送给人工耳蜗患者(总刺激速率:20千赫兹,10个峰值,每个刺激通道的速率可以达到2千赫兹)。但是,ACE策略把有一些重要的低幅度包络信息丢失了。这可能使人工耳蜗患者在比较嘈杂的背景噪声下并不能有效提取相对较弱的时域包络信号(大部分的噪声信号被映射到动态范围的较低部分)。

发明内容

本发明所要解决的技术问题在于,提供一种人工电子耳蜗、一种双刺激速率言语处理方法以及对应的言语处理器,用于解决现有人工电子耳蜗中言语处理器对高、低刺激频率不能兼顾从而造成患者使用人工电子耳蜗时造成的信息丢失或含混不清等问题。

为解决上述技术问题,本发明提供一种双刺激速率言语处理方法,应用在人工电子耳蜗中:

对语音信号经预处理、带通滤波、半波整流、低通滤波后获取每个通道的包络幅度,并将电流幅度调整至工作幅度范围;

选取包络幅度大于或等于阈值的多个通道组成第一部分(高幅度)通道,对第一部分通道采用第一(高)刺激速率的脉冲序列调制;

选取包络幅度小于阈值的多个通道组成第二部分(低幅度)通道,对第二部分通道采用第二(低)刺激速率的脉冲序列调制;

采用调制后的第一、第二部分通道的电脉冲序列刺激对应的刺激电极。

进一步,较佳地,所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。

较佳地,所述第一刺激速率是2000赫兹。根据系统总的速率和使用第一刺激速率的通道数,第一刺激速率可以在500赫兹至5000赫兹之间选择。

较佳地,所述第二刺激速率是250赫兹。根据系统总的速率和使用第二刺激速率的通道数,第二刺激速率可以在200赫兹至500赫兹之间选择。

本发明还提供一种人工电子耳蜗,包括言语处理器,所述言语处理器包括:预处理模块、带通滤波模块、半波整流模块、低通滤波模块、幅度调整模块、短时包络幅度比较器、脉冲调制模块,其中,

预处理模块对输入语音信号进行预处理后,由带同滤波模块进行带通滤波,再由半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范围发送至短时包络幅度比较器;

短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道;

脉冲调制模块,用于对第一部分通道采用第一刺激速率的脉冲序列调制,对第二部分通道采用第二刺激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲序列应用于刺激对应的刺激电极。

所述阈值是固定值;或者,所述阈值是对包络幅度由大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。

所述第一刺激速率是2000赫兹。根据系统总的速率和使用第一刺激速率的通道数,第一刺激速率可以在500赫兹至5000赫兹之间选择。所述第二刺激速率是250赫兹。根据系统总的速率和使用第二刺激速率的通道数,第二刺激速率可以在200赫兹至500赫兹之间选择。

本发明还提供一种言语处理器,包括:预处理模块、带通滤波模块、半波整流模块、低通滤波模块、幅度调整模块、短时包络幅度比较器、脉冲调制模块,其中,

预处理模块对输入语音信号进行预处理后,由带同滤波模块进行带通滤波,再由半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范围发送至短时包络幅度比较器;

短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道;

脉冲调制模块,用于对第一部分通道采用第一刺激速率的脉冲序列调制,对第二部分通道采用第二刺激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲序列应用于刺激对应的刺激电极。

所述第一刺激速率是2000赫兹。根据系统总的速率和使用第一刺激速率的通道数,第一刺激速率可以在500赫兹至5000赫兹之间选择。所述第二刺激速率是250赫兹。根据系统总的速率和使用第二刺激速率的通道数,第二刺激速率可以在200赫兹至500赫兹之间选择。

本发明的人工电子耳蜗、一种双刺激速率言语处理方法以及对应的言语处理器,采用了具有双刺激速率的连续间隔采样处理策略(DR-CIS,Dual-Rate CIS策略),DR-CIS策略是一种全新的人工电子耳蜗的言语处理策略。通过应用DR-CIS策略,本发明实现了将所有通道的包络幅度信息传送给人工电子耳蜗患者的目标,解决了ACE策略中丢失低幅度包络信息的问题。同时DR-CIS策略利用在较高包络幅度通道上的高刺激速率把对讲话者性别识别或者声调识别比较重要的时域波动信号有效地传送给人工电子耳蜗患者。更重要的是在较低包络幅度通道上使用比较低的刺激速率可以让人工电子耳蜗患者有效地感知这些低幅包络信息,从而有效地提高人工电子耳蜗的言语识别效果。

附图说明

图1是人工电子耳蜗的结构示意图;

图2是人工电子耳蜗的工作流程示意图;

图3是人工电子耳蜗使用CIS处理方法的示意图;

图4是人工电子耳蜗使用ACE处理方法的示意图;

图5是本发明采用双刺激速率方法的示意图;

图6是本发明的言语处理器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,以下结合附图对本发明作进一步地详细说明。

目前,ACE策略可提供较高刺激速率,但只刺激包络幅度较高的通道,丢失了一些重要的低幅度包络信息。而CIS策略在总刺激速率有限的情况下只能提供较低的刺激速率,导致时域信号(特别是对讲话者性别识别或者声调识别比较重要的时域波动信号)不能有效地传送给人工电子耳蜗患者。

本发明针对目前人工电子耳蜗及人工耳蜗言语处理策略对较弱信号的处理能力缺陷,采用双刺激速率的方法来克服目前言语处理策略所面临的局限性,优化人工耳蜗患者的时域检测综合能力(时域采样精度和时域检测敏感度),从而提高人工耳蜗患者在动态或者比较困难的聆听环境下的言语识别能力。

如图5所示,显示了本发明的一种双刺激速率言语处理方法,应用在人工电子耳蜗中,该双刺激速率言语处理方法包括如下步骤:

对语音信号经预处理、带通滤波、半波整流、低通滤波后获取每个通道的包络幅度,并将电流幅度调整至工作幅度范围;

选取包络幅度大于或等于阈值的多个通道组成第一部分(高幅度)通道,对第一部分通道采用第一(高)刺激速率的脉冲序列调制;

选取包络幅度小于阈值的多个通道组成第二部分(低幅度)通道,对第二部分通道采用第二(低)刺激速率的脉冲序列调制;

采用调制后的第一、第二部分通道的电脉冲序列刺激对应的刺激电极。

其中,所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。例如,在本实施例中,在24个通道中,可以选取具有最大包络幅度的6个通道,采用高刺激速率(2000赫兹)的脉冲序列调制,而对剩余的低幅度通道则用低刺激速率(250赫兹)的脉冲序列调。

利用本发明的双刺激言语处理方法,首先把采集的语音信号预处理,再通过特定数目(24个)的带通滤波器;使用半波整流以及低通滤波器的方法提取出每个通道的包络幅度;用非线性函数转换成适合患者电刺激的电流幅度,具体可采用压缩幅度的方式实现;再利用短时包络幅度比较器来比较所有通道的包络幅度的大小,具有最大包络幅度的6个通道用高刺激速率(2000赫兹)的脉冲序列调制,其他低幅度通道则用低刺激速率(250赫兹)的脉冲序列调制;最后,再把各个通道调制后的电脉冲序列刺激相对应的电极(低频通道刺激位于蜗顶的电极而高频通道刺激位于蜗底的电极)。

如图6所示,本发明的一种言语处理器,包括:预处理模块601、带通滤波模块602、半波整流模块603、低通滤波模块604、幅度调整模块605、短时包络幅度比较器606、脉冲调制模块607,其中,

预处理模块601对输入语音信号进行预处理后,由带同滤波模块602进行带通滤波,再由半波整流模块603进行半波整流,由低通滤波模块604对整流后的信号进行低通滤波后将每个通道的包络幅度发送至幅度调整模块605,幅度调整模块将每个通道的包络幅度调整至工作幅度范围发送至短时包络幅度比较器606;

短时包络幅度比较器606,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道;

脉冲调制模块607,用于对第一部分通道采用第一刺激速率的脉冲序列调制,对第二部分通道采用第二刺激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲序列应用于刺激对应的刺激电极。

所述第一刺激速率是2000赫兹。根据系统总的速率和使用第一刺激速率的通道数,第一刺激速率可以在500赫兹至5000赫兹之间选择。所述第二刺激速率是250赫兹。根据系统总的速率和使用第二刺激速率的通道数,第二刺激速率可以在200赫兹至500赫兹之间选择。

基于上述言语处理器及言语处理方法,本发明还提供一种人工电子耳蜗,如图6所示,包括言语处理器,所述言语处理器包括:预处理模块601、带通滤波模块602、半波整流模块603、低通滤波模块604、幅度调整模块605、短时包络幅度比较器606、脉冲调制模块607,其中,

预处理模块对输入语音信号进行预处理后,由带通滤波模块进行带通滤波,再由半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范围发送至短时包络幅度比较器;

短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道;

脉冲调制模块,用于对第一部分通道采用第一刺激速率的脉冲序列调制,对第二部分通道采用第二刺激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲序列应用于刺激对应的刺激电极。

所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。

所述第一刺激速率是2000赫兹。根据系统总的速率和使用第一刺激速率的通道数,第一刺激速率可以在500赫兹至5000赫兹之间选择。所述第二刺激速率是250赫兹。根据系统总的速率和使用第二刺激速率的通道数,第二刺激速率可以在200赫兹至500赫兹之间选择。

具体实施时,预处理模块601把采集的语音信号预处理,再通过特定数目(24个)的带通滤波模块602;使用半波整流模块603以及低通滤波模块604提取出每个通道的包络幅度;幅度调整模块605用非线性函数转换成适合患者电刺激的电流幅度;利用短时包络幅度比较器606来比较所有通道的包络幅度的大小,选择出具有最大包络幅度的6个通道,脉冲调制模块607用高刺激速率(2000赫兹)的脉冲序列调制,脉冲调制模块607对其他低幅度通道则采用低刺激速率(250赫兹)的脉冲序列调制;把各个通道调制后的电脉冲序列刺激相对应的电极(低频通道刺激位于蜗顶的电极而高频通道刺激位于蜗底的电极)。

以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号