首页> 中国专利> 一种基于自然语言处理和时序卷积网络的抑郁症检测方法

一种基于自然语言处理和时序卷积网络的抑郁症检测方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明提供一种基于自然语言处理和时序卷积网络的抑郁症检测方法，具体包括：构建训练样本集和抑郁症词料库，训练样本集为访谈人员的语音对应转换的文本信息，抑郁症词料库为人工制作；将训练样本集与抑郁症词料库中的文本信息转换为文本嵌入向量；将文本嵌入向量输入时序卷积网络TCN进行训练，得到抑郁症预测模型；基于获得的抑郁症预测模型，使用测试数据进行预测得到预测结果；根据预测结果对访谈人员进行分类，确定其是否属于抑郁症用户。本发明使用自然语言处理技术，增加了与话题情景相关联的言语信息；使用时序卷积网络TCN以卷积的方式进行序列数据的处理，取得了很高的精度，实现了基于文本的抑郁症检测方法。

著录项

公开/公告号CN112927781A

专利类型发明专利
公开/公告日2021-06-08

原文格式PDF
申请/专利权人杭州医典智能科技有限公司;
展开▼

申请/专利号CN202110184550.3
发明设计人张光华;李明定;杨忠丽;武海荣;
展开▼

申请日2021-02-10
分类号G16H20/70(20180101);G16H50/20(20180101);G06F40/205(20200101);G06N3/04(20060101);G06N3/08(20060101);
代理机构14115 太原申立德知识产权代理事务所(特殊普通合伙);
代理人郭海燕
地址 311100 浙江省杭州市余杭区仓前街道杭塘路2622号2幢212室
入库时间 2023-06-19 11:17:41

说明书

技术领域

本发明涉及深度学习技术领域，尤其涉及一种基于自然语言处理和时序卷积网络的抑郁症检测方法。

背景技术

抑郁症是最常见的抑郁障碍，以显著而持久的心境低落为主要临床特征，是心境障碍的主要类型。抑郁症已经成为世界第四大疾病，我国抑郁症患病率达到了6.1％。在临床中，对抑郁症的检测误诊率较高，治疗效果改善率不明显，因此，我国对抑郁症的医疗防治还处在识别率低的局面，地级市以上的医院对其识别率不足20％，只有不到10％的患者接受了相关的药物治疗；而且，抑郁症的发病(和自杀事件)已开始出现低龄(大学，乃至中小学生群体)化趋势。因此，对抑郁症的科普、防范、治疗工作亟待重视，抑郁症防治已被列入全国精神卫生工作重点。

在现有技术中，抑郁症的检测方法主要有基于音频特征的检测方法和基于面部表情视频的检测方法。以上方法通过语音特征或者面部的特征等来检测抑郁症，缺少了与话题情景相关联的言语信息，使得检测的判别性信息不足，从而降低了抑郁症的识别精度，最终影响了对抑郁症的检测。在自然语言处理技术中，对于文本的处理大多采用RNN、LSTM等，最近的研究结果表明卷积结构在音频合成和机器翻译等任务上的性能优于递归网络。

发明内容

本发明的目的是基于上述技术现状，提供一种基于自然语言处理和时序卷积网络的抑郁症检测方法。

一种基于自然语言处理和时序卷积网络的抑郁症检测方法，包括如下步骤：

步骤1：构建训练样本集和抑郁症词料库，训练样本集为访谈人员的语音对应转换的文本信息，抑郁症词料库为人工制作；

步骤2：将训练样本集与抑郁症词料库中的文本信息转换为文本嵌入向量；

步骤3：将文本嵌入向量输入时序卷积网络TCN进行训练，得到抑郁症预测模型；

步骤4：基于获得的抑郁症预测模型，使用测试数据进行预测得到预测结果；

步骤5：根据预测结果对访谈人员进行分类，确定其是否属于抑郁症用户。

进一步，所述步骤2使用Bert模型，将文本信息中按照时间顺序排列的若干个句子分别转换为文本嵌入模型，得到按照时间顺序排列的若干个句子级的文本嵌入向量。

进一步，所述步骤3中时序卷积网络TCN主要包括因果卷积、扩张卷积与残差模块；

所述TCN可以表示为：

TCN＝1D FCN+因果卷积

其中，1D FCN＝1D的卷积网络(FCN)框架；

所述因果卷积可以实现从未来到过去不会有信息泄露，在某一时刻的输出与某时间序列有关；基于因果卷积只能回顾线性大小深度的网络，应用扩张卷积扩大感受野，所述扩张卷积可以表示为：

其中，d是膨胀因子，k是filter大小，s-d·i代表过去的方向。

基于上述过程中网络加深后的稳定性，用残差模块代替一般的卷积层；

基于上述过程，TCN可以实现序列建模。

与现有技术相比，本发明的有益效果如下：

1)现有的抑郁症检测方法多使用基于音频和面部表情的视频数据，与其相比，本发明使用基于文本的数据，使用自然语言处理技术，增加了与话题情景相关联的言语信息；

2)现有技术大部分使用RNN、LSTM来处理文本信息，与其相比，本发明使用时序卷积网络TCN以卷积的方式进行序列数据的处理，取得了很高的精度。而且时序卷积网络TCN的结构也更加简单明了。

3)现有技术大部分只是用访谈人员数据作为输入，与其相比，本发明中使用了获得的访谈人员文本信息嵌入向量和抑郁症词料库关键词的嵌入向量融合后的新向量作为时序卷积网络TCN的输入。将两者结合作为输入训练抑郁症模型，可以增加抑郁症模型对于有关抑郁症词汇的敏感性，从而提高模型的预测精度。

附图说明

图1为基于自然语言处理和时序卷积网络的抑郁症检测方法处理步骤示意框图；

图2为基于自然语言处理和时序卷积网络的抑郁症检测方法流程图；

图3为文本信息的示意图；

图4为基于Bert模型的文本嵌入处理流程示意图；

图5为时序卷积网络TCN网络结构图；

图6为隐藏层中的残差块示意图。

具体实施方式

下面结合具体实施例对本发明作进一步详细描述。这些实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于以下实施例。

首先，对本发明实施例中涉及到的模型以及测量指标进行说明。

自然语言处理中的Bert(Bidirectional Encoder Representations fromTransformers)模型表示转换器的双向编码器表示，Bert通过在所有层的上下文联合调节来预训练深层双向表示。因此，只需一个额外的输出层就可以对预先训练好的Bert表示进行微调，以便为各种任务创建最先进的模型。

本发明使用时间卷积神经网络TCN来训练模型。在时序建模中，RNN、LSTM较为常用，但是，最近有些研究工作表明，CNN(卷积神经网络)在某些时序任务上也取得了顶尖的实验效果。TCN网络结合了CNN方面中一些最新的技巧，并且重新设计了sequential CNN模型，用卷积的方式进行序列数据的处理。其不但取得了与RNN、LSTM、GRU等更加复杂模型相当的精度，而且TCN的网络结构结构更加简单明了。

本发明中使用的测量指标为PHQ-8(八项病人健康问卷抑郁量表)，PHQ-8是在大型临床研究中建立的一种有效的抑郁障碍检测和严重程度的测量工具。PHQ-8由9个标准中的8个组成，第九个问题用来评估自杀或自残的想法，之所以省略，是面试官无法通过电话提供充分的干预。研究表明，删除这一问题对得分的影响很小，因为在一般人群中，自我伤害的想法相当少见。当被测用户PHQ-8的总分为0到4分表示没有明显的抑郁症状；总分5到9分代表轻度抑郁症状；10到14分代表中度抑郁症状；15到19分代表中度严重抑郁症状；20到24分代表重度抑郁症状。

基于此，如图1所示，其为本发明实施例提供的基于自然语言处理和时序卷积网络的抑郁症检测方法处理步骤示意框图，其主要由5部分组成，分别为：获取语音信息、转录文本信息、Bert建模、时序卷积网络TCN训练、测试。

前两个模块是对训练数据的构建，先对获取的语音信息进行预处理，再转录成文本信息；然后用中文文本的Bert预训练模型对文本信息和抑郁症词料库关键词进行处理，获得文本嵌入向量；再将文本嵌入向量作为TCN网络的输入，用TCN网络进行模型训练，在训练过程中，采用Adam优化器以优化模型；最后用测试数据对模型进行测试，在测试过程中，模型根据PHQ-8评分的预测，对是否患有抑郁症进行分类。

具体地，本发明实施例提供的基于自然语言处理和时序卷积网络的抑郁症检测方法流程如图2所示，该方法包括以下步骤：

S21：构建训练样本集和抑郁症词料库，将访谈人员的语音信息转换为文本信息，词料库为人工制作。

采用访谈的形式来收集训练数据，参与访谈的人员中包含抑郁人员和非抑郁人员。在访谈过程中，临床医生与访谈人员通过面对面交流或者采用在线的形式进行交流。临床医生会提出一系列专门针对识别抑郁症症状的问题，例如，你高兴吗、你认为自己更害羞或外向吗、你对自己的评价等问题。访谈过程中采用头戴式的麦克风录制音频。

采集到语音信息后，将采集的语音信息进行预处理。首先从音频中删除访谈人员的个人姓名、具体日期和地点，以保护访谈人员的隐私；同时删除临床医生的提问语音和空白语音，以保证输入到模型中的数据只包含访谈人员的数据。

对语音信息预处理之后，将语音信息转换为文本信息，具体操作过程为：首先，通过转换工具将语音信息转换为文本信息；然后，技术人员对机器翻译的文本进行校对。

如图3所示，左侧问题为临床医生的提问，右侧对应文本为访谈人员的回答。在转录文本时，仅保留访谈人员的回答，其余内容全部删除。对应文本即为训练数据。

抑郁症词料库为人工收集的与抑郁症相关的常见关键词。词料库中部分关键词如表1所示。

表1

本发明实施例中将抑郁症词料库的相关关键词分为四类，第一类为与抑郁症极度相关的关键词，例如自杀，有自杀倾向是抑郁症的一个显著特征，而且有很多抑郁症患者知道自己患有抑郁症或者是精神疾病，因此和自杀、抑郁症相关的词为高度相关的关键词；第二类为与睡眠、睡眠困难相关的关键词，例如睡眠困难、睡不着，抑郁症患者通常伴随着长期失眠和食欲不振等的症状，这里将有关失眠的关键词单独提取出来作为一类；第三类为与抑郁症常见症状相关的关键词，例如无助、焦虑，这一类词说明了抑郁症的典型症状，正常人偶尔会发生失落的心理，但抑郁症患者会长期处于沮丧的状态；第四类为与抑郁症相关性较小的关键词，例如暴躁、愤怒，这一类词相关性比较小的，因为正常人也会出现暴躁、愤怒的现象。

S22：将获得的文本信息和抑郁症词料库关键词转换为文本嵌入向量。

获得文本信息之后，使用Bert模型，将文本信息中按照时间顺序排列的若干个句子分别转换为文本嵌入模型，得到按照时间顺序排列的若干个句子级的文本嵌入向量。

如图4所示，本发明实施例使用了基于Bert模型的句子级别文本嵌入，并且本发明中使用了基于中文文本的Bert预训练模型处理中文文本信息，将访谈人员的每句话进行句子级别的文本嵌入，转换为1*768维的向量；将抑郁症词料库中每个关键词转换为768维的向量。然后将所有的向量输入到融合网络中，将文本信息句子级别的文本嵌入向量和抑郁症词料库中多个向量进行融合，然后输出一个768维向量。

S23：基于得到的文本嵌入向量，利用时序卷积网络训练抑郁症模型。

如图5所示，将得到的文本嵌入向量作为时序卷积网络的输入，使用时序卷积网络来训练模型，具体步骤为：

步骤1：输入768维的文本嵌入向量；

步骤2：分别经过TCN网络中的隐藏层1、隐藏层2、隐藏层3、隐藏层4的4个学习模块进行特征学习；

每一个隐藏层中均包含因果卷积、扩张卷积以及残差块，并且每一个隐藏层的维度为50维。图6为隐藏层中的残差块，在残差块中，TCN具有两层扩展的因果卷积和非线性，并使用了校正线性单元(ReLU)。对于标准化，将权重标准化应用于卷积滤波器。在标准残差网络中，输入被直接添加到残差函数的输出中，而在TCN中，输入和输出可以具有不同的宽度。为了解释不同的输入输出宽度，TCN网络中使用额外的1x1卷积来确保元素加法⊕接收相同形状的张量。

步骤3：将隐藏层4的输出作为全连接层的输入；

步骤4：输出结果。

S24：基于获得的抑郁症预测模型，使用测试数据进行结果预测。

通过TCN网络和训练数据训练后得到抑郁症预测模型，然后用测试数据集测试模型的准确性，此抑郁症模型可以对访谈用户PHQ-8评分的预测，并对访谈人员是否患有抑郁症进行分类。

S25：输出访谈人员是否为抑郁症患者。

综上，本发明结合自然语言处理和时序卷积网络TCN得到的信息，实现高精度的抑郁症检测，其主要技术内容包括：语音-文本转录：利用专业的转录工具对语音信息进行转录，然后技术人员对转录的文本进行修改；采用Bert模型：使用基于中文文本的Bert预训练模型处理文本信息和抑郁症词料库关键词，将访谈人员的每句话进行句子级别的嵌入，将抑郁症词料库中每个关键词转换为768维向量，然后将得到所有向量输入到融合网络中得到一个768维向量；基于时序卷积网络TCN的抑郁症分类模型：利用TCN网络的平行性、感受野大小灵活、可变长度输入、低内存要求等特性，实现了基于文本的抑郁症检测方法。

通过具体实施方式的说明，应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解，然而所附图示用于提供参考与说明，并非用来对本发明加以限制。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于自然语言处理和时序卷积网络的抑郁症检测方法 [P] . 中国专利： CN112927781A . 2021-06-08
2. 一种基于3D卷积网络的动作时序检测方法 [P] . 中国专利： CN112949544A . 2021-06-11
3. Multi-scale aware pedestrian detection method based on improved full convolutional network [P] . US10977521B2 . 2021-04-13

机译：基于改进的全卷积网络的多尺度意识步行检测方法
4. MULTI-SCALE SENSING PEDESTRIAN DETECTION METHOD BASED ON IMPROVED FULL CONVOLUTIONAL NETWORK [P] . 世界知识产权组织专利： WO2019232836A1 . 2019-12-12

机译：基于改进的全卷积网络的多尺度传感行人检测方法
5. A method for diagnosing or predicting depression or for monitoring the progress or evaluating the treatment of depression based on increased neurotrophin-3 levels in the CSF [P] . 德国专利： DE60031518T2 . 2007-08-30

机译：一种基于CSF中增加的Neurotrophin-3水平来诊断或预测抑郁症或监测抑郁症的进展或评估其治疗的方法