首页> 中国专利> 一种基于语音识别的调解智能机器人及调解方法

一种基于语音识别的调解智能机器人及调解方法

摘要

本发明公开了一种基于语音识别的调解智能机器人及调解方法,机器人包括主控器、声音采集器、无线通信模块、人机交互屏、音箱和电源模块,声音采集器连接主控器,用于采集当前各用户的语音信息并发送给主控器;主控器通过无线通信模块与服务器相连接,无线通信模块用于将用户的语音信息上传至服务器中进行音量、语音内容和声纹识别,以判断用户之间是否有发生争吵和用户之间的关系,并将判断结果返回给主控器;主控器用于在发生争吵情况下根据用户之间的关系调用相应的调解音频或视频,并由人机交互屏播放调解视频和由音箱播放调解音频。本发明可以针对性和智能化地调解用户,能更有效地阻止争吵。

著录项

  • 公开/公告号CN112712808A

    专利类型发明专利

  • 公开/公告日2021-04-27

    原文格式PDF

  • 申请/专利权人 广东机电职业技术学院;

    申请/专利号CN202110101326.3

  • 发明设计人 王建宣;张严林;

    申请日2021-01-26

  • 分类号G10L17/00(20130101);G10L17/02(20130101);G10L17/26(20130101);G10L15/26(20060101);G10L15/30(20130101);B25J11/00(20060101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人郑浦娟

  • 地址 510515 广东省广州市白云区同和蟾蜍石东路2号

  • 入库时间 2023-06-19 10:44:55

说明书

技术领域

本发明涉及机器人技术领域,特别涉及一种基于语音识别的调解智能机器人及调解方法。

背景技术

现实家庭生活中,家庭成员之间发生争吵纠纷的不在少数,目前专用于化解家庭矛盾的智能机器人较少,现有的装置一般只是简单的识别语音的音量,或者识别语音对话来判断是否吵架,但没有进一步判断是属于家庭的夫妻矛盾、亲子矛盾还是婆媳矛盾等哪种家庭矛盾,缺少针对性的语音交互,阻止争吵的手段有限,未能达到预想的调解效果。

发明内容

本发明的第一目的在于克服现有技术的缺点与不足,提供一种基于语音识别的调解智能机器人,该机器人可以针对性和智能化地调解用户,能更有效地阻止争吵。

本发明的第二目的在于提供一种基于语音识别的调解方法。

本发明的第一目的通过下述技术方案实现:一种基于语音识别的调解智能机器人,包括主控器、声音采集器、无线通信模块、人机交互屏、音箱和电源模块,声音采集器连接主控器,用于采集当前各用户的语音信息并发送给主控器;

主控器通过无线通信模块与服务器相连接,无线通信模块用于将用户的语音信息上传至服务器中进行音量、语音内容和声纹识别,以判断用户之间是否有发生争吵和用户之间的关系,并将判断结果返回给主控器;

主控器用于将录入的用户语音信息及其判断结果存储在其内部的数据库中,并在发生争吵情况下根据用户之间的关系调用数据库中相应的调解音频或视频;

人机交互屏连接主控器,用于供用户设置各组件的工作参数,用于播放主控器调用的调解视频;

音箱连接主控器,用于播放主控器调用的调解音频;

电源模块连接主控器、声音采集器、无线通信模块、人机交互屏和音箱,并为这些组件供电。

优选的,数据库还存储有音频滤镜、利用人机交互屏预先录入的各用户的语音模板以及与语音模板相对应的用户之间的关系,音频滤镜用于对调解素材的音频进行卡通处理,主控器通过无线通信模块将语音模板和用户之间的关系上传至服务器。

优选的,服务器具有词语库,词语库中存储有吵架相关词语。

优选的,调解音频包括用户预先录制好的提醒音频、预先联网下载或导入的用于调节情绪的音频,以及预先通过服务器生成的用于语音交互的交互音频;

调解视频包括用户预先录制好的提醒视频、预先联网下载或导入的用于调节情绪的视频。

优选的,无线通信模块为wifi模块或者2G/3G/4G/5G模块,声音采集器为麦克风,人机交互屏为触摸屏,主控器为单片机,服务器为云服务器。

优选的,主控器还通过无线通信模块与外部计算设备相连接,外部计算设备用于设置各组件的工作参数、录入用户的语音模板以及与语音模板相对应的用户之间的关系,并通过无线通信模块将工作参数、语音模板和用户之间的关系传输给主控器。

更进一步的,外部计算设备包括电脑和智能手机。

本发明的第二目的通过下述技术方案实现:一种基于语音识别的调解方法,所述方法应用于本发明第一目的所述的基于语音识别的调解智能机器人,包括如下步骤:

S1、上电启动调解智能机器人,先通过人机交互屏或外部计算设备设置各组件的工作参数、录入各用户的语音模板以及与语音模板相对应的用户之间的关系;

S2、利用声音采集器采集当前各用户的语音信息,并发送给主控器,主控器将语音模板、用户之间的关系和用户的语音信息存储在其内部的数据库中,并通过无线通信模块将用户语音信息、用户的语音模板以及用户之间的关系上传至服务器;

S3、利用服务器对用户语音信息进行音量、语音内容和声纹识别,判断用户之间是否有发生争吵和用户之间的关系,并将判断结果返回给主控器,主控器将判断结果存储在其内部的数据库中;

S4、当判断用户当前正在争吵时,利用主控器根据用户之间的关系调用数据库中相应的调解音频或视频,并由人机交互屏播放主控器调用的调解视频,由音箱播放主控器调用的调解音频,以对用户进行调解和情绪调节。

优选的,在步骤S3中,服务器进行音量、语音内容和声纹识别的过程具体如下:

(1)服务器采用声纹识别算法,对录入的各个用户的语音信息与语音模板进行声纹比对,判断是否有相匹配的语音模板,从而根据语音模板确定语音信息是属于哪些用户,进而确定当前用户之间的关系;

(2)服务器将音量与预设的吵架音量阈值进行比较,判断音量是否达到吵架音量阈值,以及采用语音识别算法识别用户语音信息的内容,判断用户语音信息中是否含有词语库中的吵架相关词语;

在音量达到吵架音量阈值,同时用户语音信息含有吵架相关词语的情况下,服务器判定用户此时正在争吵。

本发明相对于现有技术具有如下的优点及效果:

(1)本发明通过识别声纹、音量和语音内容,判断是否语音信息是属于哪些用户、是否达到吵架音量、语音中是否包含了吵架相关词语,通过这些判断来确认是否出现了争吵以及用户之间的关系,以便确定是亲子矛盾或者婆媳矛盾等常见矛盾中的哪种矛盾,由此可以针对性且智能地进行调解,尽量在出现纠纷的初期化解矛盾。

(2)本发明机器人在调解的过程中,可以根据用户之间的关系播放合适的预先录制的提醒音频、预先联网下载或导入的音乐、笑话、相声等等,也可以与用户进行语音交互,调解的方式更多样化,交互性更佳。

(3)本发明将声纹识别和语音识别算法上移至服务器处理,既简化了调解智能机器人的算法设计,减少了调解智能机器人的计算量,提高了计算效率,又方便算法的升级更新。

(4)本发明为保护用户隐私,提高隐私安全,所有用户的各种语音信息均存放于主控器,上传服务器仅用于比对和识别,服务器不作保存。

附图说明

图1是本发明调解智能机器人各组件的连接示意图。

图2是本发明调解方法的流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

本实施例公开了一种基于语音识别的调解智能机器人,如图1所示,包括主控器1、声音采集器2、无线通信模块3、人机交互屏4、音箱5和电源模块6。

其中,声音采集器连接主控器,用于采集当前各用户的语音信息并发送给主控器。声音采集器可采用麦克风。

主控器通过无线通信模块与服务器相连接,无线通信模块用于将用户的语音信息上传至服务器7中进行音量、语音内容和声纹识别,并将结果返回给主控器。

在本实施例中,可直接将声纹识别算法和语音识别算法上传到服务器中,以实现声纹识别和语音识别,声纹识别算法和语音识别算法可采用机器学习算法。

声纹识别的目的是判断语音信息是属于哪些用户,以便确定用户之间的关系,用户之间的关系例如可以是夫妻、亲子、兄弟姐妹、婆媳、朋友等。音量识别和语音内容识别的目的是,判断音量是否超过预设的吵架音量阈值,判断语音内容是否含有吵架相关词语,由于吵架的时候通常有吵架相关词语如粗话等不文明词汇,并且音量会比较大,因此通过对音量、语音内容的识别,可以判断用户之间是否有发生争吵。

主控器用于将录入的用户语音信息及其判断结果存储在其内部的数据库中,并在发生争吵情况下根据用户之间的关系调用数据库中相应的调解音频或视频。

这里,调解音频包括用户预先录制好的提醒音频、预先联网下载或导入的用于调节情绪的音频例如音乐、笑话、相声等等,以及预先通过服务器生成的用于语音交互的交互音频。调解视频包括用户预先录制好的提醒视频、预先联网下载或导入的用于调节情绪的视频。

比如,对于夫妻矛盾,可以提前选择好夫妻共同喜欢、有特殊意义的音乐,如纪念日、约会时听过的音乐等;对于亲子矛盾,可以提前录制好小孩或家长之前做出的承诺、录制一些轻松俏皮的语音/视频等。

数据库还存储有音频滤镜,音频滤镜可用于对调解素材的音频的卡通处理,提高调节气氛、缓解愤怒情绪的效果。另外,数据库还存储有利用人机交互屏预先录入的各用户的语音模板以及与语音模板相对应的用户之间的关系,在服务器进行声纹识别之前,主控器将语音模板和用户之间的关系上传至服务器,以便可以与用户语音信息进行声纹比对。

服务器具有词语库,词语库中存储有吵架相关词语,可以在语音内容识别过程中,用来判断语音中是否含有这些词语。

在本实施例中,主控器可采用单片机,无线通信模块可采用wifi模块或者2G/3G/4G/5G模块。服务器可以是云服务器,词语库可通过云上传吵架相关词语来进行更新和扩充。

人机交互屏连接主控器,用于播放主控器调用的调解视频,人机交互屏可采用触摸屏。音箱连接主控器,用于播放主控器调用的调解音频。

人机交互屏还用于供用户设置各组件的工作参数,录入各用户的语音模板,以及不同语音模板所对应的用户之间的关系。工作参数例如设置主控器调用的音频或视频、设置无线连接和音频播放音量等设备参数。

电源模块连接主控器、声音采集器、无线通信模块、人机交互屏和音箱,并为这些组件供电,电源模块可采用可充电电池。

另外,主控器还通过无线通信模块与外部计算设备8相连接,用户可以通过外部计算设备设置各组件的工作参数、录入用户的语音模板以及与语音模板相对应的用户之间的关系,并通过无线通信模块将工作参数、语音模板和用户之间的关系传输给主控器。外部计算设备包括电脑和智能手机,可以在外部计算设备安装有调解智能机器人控制软件,用户通过该软件对机器人进行相应设置。

本实施例还公开了一种基于语音识别的调解方法,可应用在上述调解智能机器人,如图2所示,包括如下步骤:

S1、上电启动调解智能机器人,先通过人机交互屏或外部计算设备设置各组件的工作参数,录入各用户的语音模板,以及与语音模板相对应的用户他们之间的关系。

S2、利用声音采集器采集当前各用户的语音信息,并发送给主控器,主控器将语音模板、用户之间的关系和用户的语音信息存储在其内部的数据库中,并通过无线通信模块将用户语音信息、用户的语音模板以及用户之间的关系上传至服务器。

S3、利用服务器对用户语音信息进行音量、语音内容和声纹识别,判断用户之间是否有发生争吵和用户之间的关系,并将判断结果返回给主控器,主控器将判断结果存储在其内部的数据库中。

其中,服务器进行音量、语音内容和声纹识别的过程具体如下:

(1)服务器采用声纹识别算法,对录入的各个用户的语音信息与语音模板进行声纹比对,判断是否有相匹配的语音模板,在有相匹配的语音模板的情况下,根据语音模板确定语音信息是属于哪些用户,进而确定当前用户之间的关系;

(2)服务器将音量与预设的吵架音量阈值进行比较,判断音量是否达到吵架音量阈值,以及采用语音识别算法识别用户语音信息的内容,判断用户语音信息中是否含有词语库中的吵架相关词语;

在音量达到吵架音量阈值,同时用户语音信息含有吵架相关词语的情况下,服务器判定用户此时正在争吵。因此,结合当前用户之间的关系就可以判断出是属于夫妻矛盾、亲子矛盾或者婆媳矛盾等常见矛盾中的哪一种矛盾,后续即可根据矛盾类型针对性地调用合适的调解视频/音频。

S4、当判断用户当前正在争吵时,利用主控器根据用户之间的关系调用数据库中相应的调解音频或视频,并由人机交互屏播放主控器调用的调解视频,由音箱播放主控器调用的调解音频,以对用户进行调解和情绪调节。

在调用调解音频或视频时,调解智能机器人优先播放提前录制好的提醒音频,并且播放过程中还可以进行简单的语音交互。语音交互过程中,用户还可以告诉机器人已完成调解,机器人则停止播放音频/视频。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号