首页> 中国专利> 一种使用音频数据的抑郁程度检测方法

一种使用音频数据的抑郁程度检测方法

摘要

本发明公开了一种使用音频数据的抑郁程度检测方法,包括以下步骤:1)获取若干音频数据样本;2)对各音频数据样本进行特征提取;3)根据步骤2)提取的特征获取全局特征,然后将各音频数据样本进行分割,获取分割得到的各段样本的全局特征;4)根据步骤3)得到的各段样本的全局特征对深度卷积网络模型进行训练,然后利用训练后的深度卷积网络模型检测待检测对象的忧郁程度,该方法能够较为准确检测忧郁程度。

著录项

  • 公开/公告号CN112998709A

    专利类型发明专利

  • 公开/公告日2021-06-22

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN202110212777.4

  • 申请日2021-02-25

  • 分类号A61B5/16(20060101);A61B5/00(20060101);

  • 代理机构61200 西安通大专利代理有限责任公司;

  • 代理人张海平

  • 地址 710049 陕西省西安市咸宁西路28号

  • 入库时间 2023-06-19 11:34:14

说明书

技术领域

本发明涉及一种抑郁程度检测方法,具体涉及一种使用音频数据的抑郁程度检测方法。

背景技术

目前,抑郁症的临床诊断标准包括:WHO正式公布的《国际疾病与健康问题分类·第10版》诊断标准、美国精神病协会《精神障碍诊断统计手册·第4版》诊断标准《中国精神障碍分类与诊断标准·第3版》诊断标准和《中国中西医结合精神疾病辨证分型诊断标准》。目前医疗上对于抑郁症疾病的诊断方法大多是专业医师根据一些医学上明确列示的诊断标准、与疑似病症患者的交流以及通过健康问卷调查等形式来进行抑郁症的诊断。然而这些诊段方法自身存在着主观性极强、灵活性较小的局限致,对抑郁程度诊断的准确性较低。

发明内容

本发明的目的在于克服上述现有技术的缺点,提供了一种使用音频数据的抑郁程度检测方法,该方法能够较为准确检测忧郁程度。

为达到上述目的,本发明所述的使用音频数据的抑郁程度检测方法包括以下步骤:

1)获取若干音频数据样本;

2)对各音频数据样本进行特征提取;

3)根据步骤2)提取的特征获取全局特征,然后将各音频数据样本进行分割,获取分割得到的各段样本的全局特征;

4)根据步骤3)得到的各段样本的全局特征对深度卷积网络模型进行训练,然后利用训练后的深度卷积网络模型检测待检测对象的忧郁程度。

步骤2)的具体操作为:

使用CONVAEP对各音频数据样本进行特征提取,其中,各特征每10毫秒一次采集一次,并提取特征,提取的特征包括F0、VUV、NAQ、QOQ、H1H2、PSP、MDQ、peakSlope、Rd、Rd_conf、MCEP_0-24、HMPDM_0-24及HMPDD_0-12。

步骤3)的具体操作为:

将各音频数据样本所有特征的10ms数据进行平均,将平均所得结果作为该音频数据样本的全局特征,然后将各音频数据样本分割为100份,求取各段样本的全局特征。

深度卷积网络模型包括男性的深度卷积网络模型及女生的深度卷积网络模型。

男性的深度卷积网络模型包括第一个卷积层、第一个池化层、第二个卷积层、第二个池化层、第三个卷积层、第三个池化层及全连接层。

女性的深度卷积网络模型包括第一个卷积层、第一个池化层、第二个卷积层、第二个池化层及全连接层。

本发明具有以下有益效果:

本发明所述的使用音频数据的抑郁程度检测方法在具体操作时,只需获取检测对象的音频数据,再将检测检测对象的音频数据输入到训练后的深度卷积网络模型中,利用训练后的深度卷积网络模型判断检测对象的忧郁程度,具有数据采集方便、检测灵活、检测速度快且检测准确性高的特点,同时避免医生诊断,保护患者的隐私。

附图说明

图1为男性的深度卷积网络模型的示意图;

图2为女生的深度卷积网络模型的示意图。

具体实施方式

下面结合附图对本发明做进一步详细描述:

本发明所述的使用音频数据的抑郁程度检测方法包括以下步骤:

1)获取若干音频数据样本,其中,在获取音频数据样本时,先获取与用户交谈时的音频数据,然后对获取的音频数据进行去噪,然后去除询问者的频谱,保证用户的音频数据,以用户的音频数据作为音频数据样本。

2)对各音频数据样本进行特征提取;

具体的,使用CONVAEP对各音频数据样本进行特征提取,其中,各特征每10毫秒一次采集一次,并提取特征,提取的特征包括F0、VUV、NAQ、QOQ、H1H2、PSP、MDQ、peakSlope、Rd、Rd_conf、MCEP_0-24、HMPDM_0-24及HMPDD_0-12,即总共13种73个特征

3)根据步骤2)提取的特征获取全局特征,然后将各音频数据样本进行分割,获取分割得到的各段样本的全局特征;

具体的,将各音频数据样本所有特征的10ms数据进行平均,将平均所得结果作为该音频数据样本的全局特征,由于每个样本的音频的时间长度不一,所以每个样本的所获取的音频的数据不同,为了达到统一数据格式的要求,并采集更多的数据,因此将各音频数据样本分割为100份,求取各段样本的全局特征。

4)根据步骤3)得到的各段样本的全局特征对深度卷积网络模型进行训练,然后利用训练后的深度卷积网络模型检测待检测对象的忧郁程度。

因为男女在音频、音色等方面巨大的差异,如果在音频上使用同样的策略,会造成很大的误差,本发明分别对男女进行建模使用不同的网络,分别预测其抑郁程度,即深度卷积网络模型包括男性的深度卷积网络模型及女生的深度卷积网络模型。

男性的深度卷积网络模型包括第一个卷积层、第一个池化层、第二个卷积层、第二个池化层、第三个卷积层、第三个池化层及全连接层。

女性的深度卷积网络模型包括第一个卷积层、第一个池化层、第二个卷积层、第二个池化层及全连接层。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号