首页> 中国专利> 一种基于能量算子的病理嗓音频谱重构方法

一种基于能量算子的病理嗓音频谱重构方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供了一种基于能量算子的病理嗓音频谱重构方法，包括病理嗓音信号基频自适应加窗、计算功率谱、重构功率谱、功率谱的频域平滑处理、计算功率倒频谱、同态滤波以及计算频谱包络。本发明公开的一种基于能量算子的病理嗓音频谱重构方法，改善了病理嗓音频谱分量过于分散的问题，能够有效提取嗓音的主要信息、频谱分量和峰值，获得重构的病理嗓音频谱包络，解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

著录项

公开/公告号CN114822567B

专利类型发明专利
公开/公告日2022.09.27

原文格式PDF
申请/专利权人天津大学;
展开▼

申请/专利号CN202210707979.0
发明设计人张涛;刘赣俊;赵鑫;
展开▼

申请日2022.06.22
分类号G10L19/02(2013.01);G10L19/26(2013.01);G10L25/21(2013.01);G10L25/24(2013.01);G10L25/66(2013.01);
代理机构天津心知意达知识产权代理事务所(普通合伙) 12260;
代理人杨正律
地址 300000 天津市南开区卫津路92号
入库时间 2022-11-28 17:50:01

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-27

授权

发明专利权授予

说明书

技术领域

本发明属于信息技术领域，尤其是涉及一种基于能量算子的病理嗓音频谱重构方法。

背景技术

病理嗓音是指由于声带组织发生病变，声带张力变小，同时声道结构功能性改变导致声带不规则振动、声门出现高次谐波、信号周期性发生改变、幅度及其频率出现波动的嗓音。病理嗓音修复是嗓音障碍研究领域的一个新方向，旨在通过修复病理嗓音信号提高语音可懂度，通过非侵入式的语音信号处理技术修复病理嗓音，可以提高病理嗓音信号的清晰度和可懂度，帮助嗓音疾病患者体验更为便利的语音交互。

发声系统的数学模型分为激励、声道和辐射共三个子模型。嗓音疾病影响的发声器官对应的是激励模型和声道模型。对于激励模型，基频表征嗓音的音调高低，是激励模型中描述声带振动频率重要的特征参数。对于声道模型，共振峰的位置、宽度、幅度等是声道参数中影响元音音色的重要参数。对于整个发声系统而言，频谱包络可以勾勒整段语音的主要信息，同时包含频谱分量、峰值幅度等主要参数。

传统的激励模型提取算法虽然具有计算复杂度低的优点，但是在提取过程中会出现峰值突变，导致二次倍频和分频错误，提取声道参数时，对纯净嗓音信号检测有效，但是在计算复杂的滤除声道卷积信号时容易发生误差，存在传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

发明内容

有鉴于此，本发明旨在提出一种基于能量算子的病理嗓音频谱重构方法，改善了病理嗓音频谱分量过于分散的问题，能够有效提取嗓音的主要信息、频谱分量和峰值，获得重构的病理嗓音频谱包络，解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

为达到上述目的，本发明的技术方案是这样实现的：

一种基于能量算子的病理嗓音频谱重构方法，包括:

步骤一: 病理嗓音信号基频自适应加窗：采用长度为

步骤二: 计算功率谱：计算步骤一中使用汉宁窗

步骤三: 重构功率谱：进一步对功率谱

步骤四：功率谱的频域平滑处理：进一步通过一个的矩形窗，对重构功率谱

步骤五：计算功率倒频谱：计算功率谱

步骤六：同态滤波：使用同态滤波函数对功率倒频谱

步骤七：计算频谱包络：对倒频谱

相对于现有技术，本发明所述的一种基于能量算子的病理嗓音频谱重构方法，具有以下优势：

本发明公开了一种基于能量算子的病理嗓音频谱重构方法，改善了病理嗓音频谱分量过于分散的问题，能够有效提取嗓音的主要信息、频谱分量和峰值，获得重构的病理嗓音频谱包络，解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题，具有提取效果好，适用性强的特点。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

在附图中：

图1为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法流程示意图；

图2为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构前示意图；

图3为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构后示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以通过具体情况理解上述术语在本发明中的具体含义。

下面将参考附图并结合实施例来详细说明本发明。

如图1所示，一种基于能量算子的病理嗓音频谱重构方法，包括:

步骤一: 病理嗓音信号基频自适应加窗：采用长度为

在本实施例中，病理嗓音信号

步骤二: 计算功率谱：计算步骤一中使用汉宁窗

步骤三: 重构功率谱：进一步对功率谱

步骤四：功率谱的频域平滑处理：进一步通过一个的矩形窗，对重构功率谱

步骤五：计算功率倒频谱：计算功率谱

步骤六：同态滤波：使用同态滤波函数对功率倒频谱

步骤七：计算频谱包络：对倒频谱

进一步的，在步骤二中：

通过上述关系式，利用快速傅里叶变换可以得到功率谱

进一步的，步骤三中:

对功率谱

其中，

进一步的，步骤四中，矩形窗宽度为

其中

进一步的，在步骤五中，因为周期为

其中，

进一步的，在步骤六中：

其中，同态滤波函数

在本实施例中，

进一步的，在步骤七中，

其中，

如图2以及图3所示，功率谱重构后信号能量集中于主要频谱分量，重构效果明显，信号特征明显好于重构前的病理嗓音信号，原本过于分散的频谱能量得以集中，重构后的频谱包络可以直接观察得到共振峰。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于能量算子的病理嗓音频谱重构方法 [P] . 中国专利： CN114822567A . 2022-07-29
2. 一种基于能量算子和频谱校正的电压波动与闪变检测方法及装置 [P] . 中国专利： CN103116064A . 2013-05-22
3. A method of encoding an input video comprising luma component and two chroma components, said method comprising the reconstruction of said input video based on a reconstruction function [P] . 日本专利： JP2019521554A . 2019-07-25

机译：一种对包括亮度分量和两个色度分量的输入视频进行编码的方法，所述方法包括基于重构函数来重构所述输入视频
4. A method for determining the level of a switch, a method for triggering of a switch on the basis of the arc power and method for determining the loading of the contacts of a switch on the basis of the arc energy [P] . 德国专利： DE102011080826B4 . 2016-01-21

机译：一种用于确定开关的水平的方法，一种用于基于电弧功率来触发开关的方法以及一种用于基于电弧能量来确定开关的触点负载的方法
5. MEANS FOR RESTORING LOST MEMORY IN NORM AND PATHOLOGY IN PATIENTS OF ALL AGE GROUPS BASED ON N, N'-SUBSTITUTED 3,7-DIAZABICYCLO 3.3.1 NONAN, A PHARMACEUTICAL COMPOSITION BASED ON IT [P] . 俄罗斯专利： RU2009126653A . 2011-01-20

机译：基于N，N'取代的3,7-二氮杂双酚[3.3.1] NONAN，一种基于IT的药物组合物，用于恢复所有年龄段患者的NOM和病理学失忆的方法