首页> 中国专利> 一种基于问答匹配的社区孤寡老人情感分析方法及系统

一种基于问答匹配的社区孤寡老人情感分析方法及系统

摘要

本公开提供了一种基于问答匹配的社区孤寡老人情感分析方法,包括:获取询问信息;对获取的询问信息进行问答匹配;符合匹配要求的询问信息,直接得到询问信息对应的答复结果;不符合要求的询问信息,依据预设的情感分析模型,得到情感分析结果;其中,情感分析模型的学习采用双任务混合学习框架,主任务判断当前语境下说话人的状态,辅助任务对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到说话人上下文向量;本公开可以关怀老人和服务居民,提高了社区服务质量,实现了智能问答;可以高效的将居民问题与社区管理处提供的语料库进行匹配,准确解答居民问题,同时,可以有效的评估孤寡老人的情感状态。

著录项

  • 公开/公告号CN113836286A

    专利类型发明专利

  • 公开/公告日2021-12-24

    原文格式PDF

  • 申请/专利权人 南开大学;

    申请/专利号CN202111129135.4

  • 申请日2021-09-26

  • 分类号G06F16/332(20190101);G06F16/35(20190101);G06F40/216(20200101);G06F40/289(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构37221 济南圣达知识产权代理有限公司;

  • 代理人祖之强

  • 地址 300071 天津市津南区海河教育园区同砚路38号

  • 入库时间 2023-06-19 13:49:36

说明书

技术领域

本公开属于养老管理技术领域,尤其涉及一种基于问答匹配的社区孤寡老人情感分析方法及系统。

背景技术

随着社会经济的发展,家庭结构的变迁,老人独居的“空巢”家庭结构成为社会的常态;城市社区的大多数空巢老人的物质生活已然得到满足,但是他们的精神需求和心理慰藉问题日益凸显,而绝大多数社区网格员只是兼职,对于重点人群的照顾难免分身乏术。发明专利“一种面向社区的健康养老服务系统(CN112185492A)”,该系统能够满足社区养老服务中的基本需求,但是存在无法解决居民(老人)的生活提问,无法对孤寡老人的心理健康状况进行检测等问题;发明专利“一种基于图神经网络嵌入匹配的知识图谱问答方法和系统(CN112765312A)公开了一种基于图神经网络嵌入匹配的知识图谱问答方法,该发明能解决现有语义解析方法其模板并不能完全适用所有的自然语言问句的技术问题,但是存在推理过程较为复杂、所需知识图谱庞大和训练耗时等问题。

本公开发明人发现,绝大多数社区网格员只是兼职,对于重点人群的照顾难免分身乏术,工作效率低;网格员对老人的精神需求进行了解时,通过聊天和人为方式的分析,不能准确的对社区孤寡老人的情感进行准确分析。

发明内容

本公开为了解决上述问题,提出了一种基于问答匹配的社区孤寡老人情感分析方法及系统,本公开可以关怀老人和服务居民,提高了社区服务质量,实现了智能问答;可以高效的将居民问题与社区管理处提供的语料库进行匹配,准确解答居民问题,同时,可以有效的评估孤寡老人的情感状态。

为了实现上述目的,本发明是通过如下的技术方案来实现:

第一方面,本公开提供了一种基于问答匹配的社区孤寡老人情感分析方法,包括:

获取询问信息;

对获取的询问信息先进行问答匹配;对符合匹配要求的询问信息,直接得到询问信息对应的答复结果;

对不符合要求的询问信息,依据预设的情感分析模型,得到情感分析结果;

其中,情感分析模型的学习采用双任务混合学习框架,主任务判断当前语境下说话人的状态,辅助任务对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到说话人上下文向量。

进一步的,对获取的询问信息进行问答匹配是指,将获取的询问信息转化为待回复问句向量,对待回复问句向量与预设的问句向量进行相似度计算。

进一步的,将获取的询问信息转化为待回复问句向量或问句向量包括:

对问句进行分词处理;

对分词后的语句进行扩充;

将扩充后的语句转换为等长的向量;

对所有向量中的对应项进行标准化处理;

对标准化处理后得到的结果进行降维处理,得到最终的待回复问句向量或问句向量。

进一步的,相似度计算是指,对待回复问句向量与预设的问句向量进行相似度计算,得到相似度最高的问句向量及其相似度值。

进一步的,若相似度值≤预设相似度值,则认为问句已被收录,直接得到对应的结果;若相似度值>预设相似度值,则认为问句暂未收入,进行提示。

进一步的,主任务判断当前语境下说话人的状态,采双向长短时记忆网络模型与注意力机制混合模型;辅助任务对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到说话人上下文向量。

进一步的,使用预训练的词向量初始化词嵌入矩阵,再利用词嵌入矩阵将输入的数据中的词转换成词向量,将双向长短时记忆网络模型输出的结果分割成前向和后向的输出,得到注意力的输出;对双向长短时记忆网络模型的输出做非线性变换和归一化处理;对注意力的输出,将一部分神经网络单元暂时从网络中丢弃。

第二方面,本公开还提供了一种基于问答匹配的社区孤寡老人情感分析系统,包括数据采集模块、问答匹配模块和情感分析模块;

所述数据采集模块,被配置为:获取询问信息;

所述问答匹配模块,被配置为:对获取的询问信息先进行问答匹配;对符合匹配要求的询问信息,直接得到询问信息对应的答复结果;

所述情感分析模块,被配置为:对不符合要求的询问信息,依据预设的情感分析模型,得到情感分析结果;

其中,情感分析模型的学习采用双任务混合学习框架,主任务判断当前语境下说话人的状态,辅助任务对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到说话人上下文向量。

第三方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了第一方面所述的基于问答匹配的社区孤寡老人情感分析方法的步骤。

第四方面,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了第一方面所述的基于问答匹配的社区孤寡老人情感分析方法的步骤。

与现有技术相比,本公开的有益效果为:

2.本公开的问答匹配模块对于小规模语料库具有很大优势,利用同义词词林扩展后的问答库,可以全面准确匹配用户问句,提高了智能问答的准确度;

2.本公开的情感分析模块对说话人的情感动态规律进行了合理建模,建立了定时分析处理机制,具备高实效性,可以有效判断老人的心理状态并及时反馈,极大提高了社区养老服务质量;

3.本公开提出了一种双任务混合学习框架,主任务融合了注意力机制和bi-LSTM模型,辅助任务主要采用BERT模型实现,提高了模型精度。

附图说明

构成本实施例的一部分的说明书附图用来提供对本实施例的进一步理解,本实施例的示意性实施例及其说明用于解释本实施例,并不构成对本实施例的不当限定。

图1为本公开实施例1的整体流程图。

具体实施方式:

下面结合附图与实施例对本公开作进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

实施例1:

如图1所示,本实施例提供了一种基于问答匹配的社区孤寡老人情感分析方法,包括:获取询问信息;对获取的询问信息进行问答匹配;符合匹配要求的询问信息,直接得到询问信息对应的答复结果;不符合要求的询问信息,依据预设的情感分析模型,得到情感分析结果;其中,情感分析模型的学习采用双任务混合学习框架,主任务判断当前语境下说话人的状态,辅助任务对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到说话人上下文向量。

在本实施例中,对获取的询问信息进行问答匹配是指,将获取的询问信息转化为待回复问句向量,对待回复问句向量与预设的问句向量进行相似度计算;其中,采用特征工程的方法对问句进行统一向量化,具体步骤如下:

对中文问句进行“结巴”分词(jieba分词);

采用同义词词林的思想对问答句进行扩充得到扩充后的句子序列;

使用TF-IDF(term frequency–inverse document frequency,词频-逆向文件频率)方法将分词后的语句转换为等长的向量(使用停用词);

对得到的所有向量中的对应项进行标准化处理;

对标准化处理后得到的结果进行PCA(Principal Component Analysis)降维处理得到最终的问句向量Pi(i=1,2,3,...)。

在本实施例中,对获取的询问信息进行问答匹配具体为:对获取或者对应系统中用户输入的查询问句P(询问信息)做上述统一向量化处理,得到同问句向量尺寸相同的待回复问句向量P’,具体为:将用户输入的问句Q依次进行上述统一向量化处理中的五个流程得到和Pi等长的待回复问句向量Q’=[q1’,q2’,q3’,...,qK’]。

使用python(计算机编程语言)中的jieba库对已有问句进行中文分词处理,得到句子序列集合B,然后在线下对问句进行扩充,在原有语句的基础上进行同义词替换生成并收录新的句子序列,并将其指向同一个答案,扩充后的句子序列集合为B’,然后使用python中的Sklearn库实现TF-IDF算法得到等长的每个句子序列的向量X

将待回复问句向量P’分别与问答库中的问句向量Pi进行相似度计算,返回相似度最高的问句及其相似度值Y,具体为:将步骤向量Q’与已收录问题的问句向量Pi进行相似度计算,得到相似度值

在本实施例中,将Y与预设值Ymax进行比较,具体为:1)若Y≤Ymax,则认为用户输入的问句已被收录进入我们的问答库中,返回给用户对应的结果;2)若Y>Ymax,则认为用户输入的问句暂未收入,这时给出提示信息或接入智能聊天平台进行答复,并进行情感分析。

具体的:对用户聊天内容输入信息进行处理,如果是文本信息,直接保存;如果是语音信息,将接收到的语音信息将通过微信提供的API接口转为文字信息再进行后续处理;对封闭域下已经录入的问答对中的问句进行扩展和向量化转换:小型封闭域下的问答对普遍较少,采用特征工程的方法对问句进行统一向量化;输入问句向量化,对用户输入的查询问句Q做上述统一向量化处理,得到同问句向量尺寸相同的待回复问句向量Q’;相似度计算,将待回复问句向量P’分别问答库中的问句向量P

本实施例中,采用双向长短时记忆网络(bi-LSTM)模型与注意力机制混合模型去判断当前语境下说话人的状态,具体措施如下:

利用词嵌入技术将句子转化为向量。

进行长短时记忆(LSTM)网络的搭建,LSTM模型是由t时刻的输入词,细胞状态,临时细胞状态,隐藏状态,遗忘门,记忆门,输出门组成;LSTM的计算过程可以概括为,通过对细胞状态中信息遗忘和记忆新的信息使得对后续时刻计算有用的信息得以传递,而无用的信息被丢弃,并在每个时间步都会输出隐层状态,其中遗忘、记忆与输出由通过上个时刻的隐层状态和当前输入计算出来的遗忘门,记忆门,输出门来控制。

在本实施例中,词嵌入使用了浮点型的稠密矩阵来表示token,token是服务端生成的一串字符串;根据词典的大小,向量设置维度为200维;其中向量中的每一个值是一个参数其初始值是随机生成的,之后会在训练的过程中进行学习中获得。

在本实施例中,预设的情感分析模型采用了一种双任务混合的学习框架;主任务判断当前语境下说话人的状态,采用(bi-LSTM)模型与注意力机制混合模型;而辅助任务利用BERT(BidirectionalEncoderRepresentationsfrom Transformer)模型对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到对话个人上下文向量;双任务结合充分利用了情感的延续性特征。使用预训练的词向量初始化词嵌入矩阵,再利用词嵌入矩阵将输入的数据中的词转换成词向量,将Bi-LSTM输出的结果分割成前向和后向的输出,进而得到注意力的输出;对Bi-LSTM的输出用激活函数做非线性变换,用softmax逻辑回归模型做归一化处理;对注意力的输出可以做dropout处理,将一部分神经网络单元暂时从网络中丢弃;优选的,为了避免过拟合,模型采用了dropout的方式,dropout丢弃率设定为了0.5;在模型训练时采用了Adam优化器进行参数优化;模型参数为:双向LSTM模型2层,隐藏层大小为64,全连接层数为2。

在本实施例中,寻找合适的语料库进行模型训练及准确度评估,系统采用的数据集是IMDB数据集,其中训练集25000条,测试集25000条,而问答匹配的语料库建立在线下的社区咨询平台和线上日常中文聊天语料库之上。

在本实施例中,对老人心理状态进行评估并记录反馈,具体的,本实施例为每一个用户记录聊天内容文档,每24小时对用户的聊天内容进行综合评估;考虑到社区应用的实用性,仅仅将综合评估结果分为两种类型:positive和negative;记录每天的评估结果,每7天向社区服务中心进行一次反馈,当发现老人超过5天心情低落时会发出预警,为社区网格员精准入户提供科学指导。

实施例2:

本实施例提供了一种基于问答匹配的社区孤寡老人情感分析系统,包括数据采集模块、问答匹配模块和情感分析模块;

所述数据采集模块,被配置为:获取询问信息;

所述问答匹配模块,被配置为:对获取的询问信息先进行问答匹配;对符合匹配要求的询问信息,直接得到询问信息对应的答复结果;

所述情感分析模块,被配置为:对不符合要求的询问信息,依据预设的情感分析模型,得到情感分析结果;

其中,情感分析模型的学习采用双任务混合学习框架,主任务判断当前语境下说话人的状态,辅助任务对对话中的语句进行编码后,通过注意力机制挖掘当前说话人的历史对话记录,得到说话人上下文向量。

本实施例的目的在于开发一种基于问答匹配的社区孤寡老人情感分析的AI助手;AI助手可以代替社区工作者发布重要公告,解答生活问题;采用情感分析和“嘘寒问暖”的方式判断老人的身心健康状态,并筛选重点关注人口反馈给社区工作者。

实施例3:

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了实施例1所述的基于问答匹配的社区孤寡老人情感分析方法的步骤。

实施例4:

本实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了实施例1所述的基于问答匹配的社区孤寡老人情感分析方法的步骤。

以上所述仅为本实施例的优选实施例而已,并不用于限制本实施例,对于本领域的技术人员来说,本实施例可以有各种更改和变化。凡在本实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实施例的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号