首页> 中国专利> 智能语音输入设备、智能语音输入系统及其控制方法

智能语音输入设备、智能语音输入系统及其控制方法

摘要

一种智能语音输入设备、智能语音输入系统及其控制方法,所述智能语音输入设备,包括:语音采集模块,用于采集外部的语音信号;语音识别模块,用于获取所述语音信号的识别结果;命令生成模块,用于对所述识别结果进行语义解析,并根据解析结果生成HID命令。上述方案,将外部的语音信号转换成对应的HID指令。当智能语音输入设备用于终端设备时,可以通过语音信号实现对相应的终端设备的控制,以提高对终端设备控制的便捷性。

著录项

  • 公开/公告号CN112669843A

    专利类型发明专利

  • 公开/公告日2021-04-16

    原文格式PDF

  • 申请/专利权人 江苏惠通集团有限责任公司;

    申请/专利号CN202011538781.1

  • 发明设计人 乔磊;肖彦果;杨蕾;顾根平;

    申请日2020-12-23

  • 分类号G10L15/22(20060101);G10L15/30(20130101);G06F40/30(20200101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人周书敏;张振军

  • 地址 212003 江苏省镇江市桃花坞新村二区24号

  • 入库时间 2023-06-19 10:38:35

说明书

技术领域

本发明实施例涉及智能设备的控制领域,尤其涉及一种智能语音输入设备、智能语音输入系统及其控制方法。

背景技术

人机交互设备(Human Interface Device,HID)输入设备是一种应用较为广泛的人机交互设备。现在很多的HID输入设备采用键盘、鼠标、按钮或传感器等方式。

在使用时,需要携带对应的HID输入设备,在一些场景下,存在HID设备携带或者放置不方便的问题,导致对智能设备控制不方便。

发明内容

本发明实施例解决的技术问题是对智能设备的控制不方便。

为解决上述技术问题,本发明实施例提供一种智能语音输入设备,包括:语音采集模块,用于采集外部的语音信号;语音识别模块,用于获取所述语音信号的识别结果;命令生成模块,用于对所述识别结果进行语义解析,并根据解析结果生成HID命令。

可选的,所述语音识别模块包括:网络通信模块,所述网络通信模块用于将所述语音信号发送至云端语音识别服务器,并接收所述云端语音识别服务器反馈的所述识别结果。

可选的,所述命令生成模块,用于根据所述解析结果确定所述智能语音输入设备待模拟的HID设备的类型,根据所述解析结果生成与所述待模拟的HID设备的类型匹配的HID命令。

可选的,所述命令生成模块根据所述解析结果中的第一类关键词,结合预配置的第一类关键词与HID设备的类型之间的映射关系,确定所述待模拟的HID设备的类型;根据所述解析结果中的第二类关键词,结合预配置的第二类关键词与指令内容之间的映射关系,确定所述HID指令的指令内容。

可选的,所述待模拟的HID设备的类型包括:键盘、鼠标、手柄、触摸面板以及传感器。

可选的,所述智能语音输入设备,还包括去噪单元,所述去噪单元用于对所述语音信号进行去噪处理。

本发明实施例还提供一种智能语音输入系统,包括:终端设备以及上述任一种智能语音输入设备,其中:所述智能语音输入设备将所述HID命令发送至所述终端设备;所述终端设备根据所述HID命令执行对应的操作。

可选的,所述智能语音输入设备通过HID协议,将所述HID指令发送至所述终端设备。

可选的,所述的智能语音输入系统还包括:云端语音识别服务器,其中:所述智能语音输入设备将所述语音信号发送至所述云端语音识别服务器;所述云端语音识别服务器,对所述语音信号进行识别,得到所述识别结果,将所述识别结果反馈至所述智能语音输入设备。

可选的,所述HID指令包括:用于智能语音输入设备待模拟的HID设备的类型的指示信息以及指令内容;所述终端设备根据所述指示信息指示的待模拟HID设备的类型以及所述指令内容执行对应的操作。

本发明实施例还提供一种基于智能语音输入系统的控制方法,所述控制方法,包括:当检测到所述智能语音输入设备连接至所述终端设备时,控制所述智能语音输入设备采集外部的语音信号;控制所述智能语音输入设备对所述语音信号的识别结果进行语义解析,并根据解析结果生成HID命令,将所述HID命令发送至终端设备。

可选的,所述智能语音输入系统的控制方法,还包括:当检测到所述智能语音输入设备连接至所述终端设备时,获取所述智能语音输入设备的设备注册信息;根据所述设备注册信息,将所述智能语音输入设备注册为对应的HID设备。

可选的,所述根据所述设备注册信息,将所述智能语音输入设备注册为对应的HID设备,包括:当所述设备注册信息包括多个类型的HID设备的注册信息时,分别将所述智能语音输入设备注册为多个对应类型的HID设备。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

智能语音输入设备的语音采集模块可以采集外部的语音信号,并通过语音识别模块获取语音识别结果,命令生成模块对识别结果进行语义解析,根据解析结果生成HID命令,从而实现将外部的语音信号转换成对应的HID指令。当智能语音输入设备用于终端设备时,可以通过语音信号实现对相应的终端设备的控制,以提高对终端设备控制的便捷性。

附图说明

图1是本发明实施例中的一种智能语音输入设备的结构示意图;

图2是本发明实施例中的一种智能语音输入系统的结构示意图;

图3是本发明实施例中的一种智能语音输入系统的控制方法的流程图。

具体实施方式

如上所述,现有技术中,通常需要采用硬件HID输入设备对终端设备进行控制,在一些场景下,当HID输入设备不便于放置或者不便于携带时,导致对终端设备的控制不便。

为了解决上述问题,在本发明实施例中,智能语音输入设备的语音采集模块可以采集外部的语音信号,并通过语音识别模块获取语音识别结果,命令生成模块对识别结果进行语义解析,根据解析结果生成HID命令,从而实现将外部的语音信号转换成对应的HID指令。当智能语音输入设备用于终端设备时,可以通过语音信号实现对相应的终端设备的控制,以提高对终端设备控制的便捷性。

为使本发明实施例的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

本发明实施例提供一种智能设备的控制方法。参照图1,给出了本发明实施例中的一种智能语音输入设备的结构示意图。

在具体实施中,智能语音输入设备10可以包括语音采集模块101、语音识别模块102以及命令生成模块103,其中:

语音采集模块101可以采集外部的语音信号。语音识别模块102可以获取语音信号的识别结果。命令生成模块103可以对识别结果进行语义解析,并根据解析结果生成HID命令。

在具体实施中,语音采集模块101可以为智能语音输入设备10自身配置的模块,也可以复用智能语音输入设备10所控制的终端设备上的语音采集模块101。

由上可知,智能语音输入设备的语音采集模块可以采集外部的语音信号,并通过语音识别模块获取语音识别结果,命令生成模块对识别结果进行语义解析,根据解析结果生成HID命令,从而实现将外部的语音信号转换成对应的HID指令,当智能语音输入设备用于终端设备时,可以通过语音信号实现对相应的终端设备的控制,以提高对终端设备控制的便捷性。

在具体实施中,智能语音输入设备10可以采用自身的语音识别模块102在智能语音输入设备10本地对语音信号进行识别,也即实现在离线时对语音信号的识别,无须依赖联网,从而可以提高智能语音输入设备使用的灵活性。

在具体实施中,智能语音输入设备10联网对语音信号进行识别。此时,语音识别模块102可以包括网络通信模块。网络通信模块可以将语音信号发送至云端语音识别服务器,并接收云端语音识别服务器反馈的识别结果。通过网络通信模块实现对语音信号的联网在线识别,以丰富语音信号的识别数据库,能够提高识别的语音信号的范围以及准确度等。

在具体实施中,命令生成模块103可以根据所述解析结果确定智能语音输入设备10待模拟的HID设备的类型,根据所述解析结果生成与HID设备的类型匹配的HID命令。

在具体实施中,智能语音输入设备10可以模拟一种类型的HID设备的类型,也可以模拟多种类型的HID设备。可以根据解析结果确定智能语音输入设备10待模拟的HID设备的类型。

具体而言,可以预配置解析结果与HID设备的类型之间的映射关系。通过根据解析结果,结合预配置的解析结果与HID设备的类型之间的映射关系,确定每次采集的语音信号指示的智能语音输入信号待模拟的HID设备的类型。

在具体实施中,所述命令生成模块103根据所述解析结果中的第一类关键词,结合预配置的第一类关键词与HID设备的类型之间的映射关系,确定所述待模拟的HID设备的类型;根据所述解析结果中的第二类关键词,确定待模拟的HID设备的类型。所述命令生成模块103根据所述解析结果中的第二类关键词,结合预配置的第二类关键词与指令内容之间的映射关系,确定HID指令的指令内容。

待模拟的HID设备的类型可以包括:键盘、鼠标、手柄、触摸面板以及传感器等。HID指令的类型与智能语音输入设备10待模拟的HID设备的类型相关。可以理解的是,待模拟的HID设备的类型并不限于上述举例,还可以保包括其他类型的HID设备,此处不再一一举例。

在具体实施中,可以预先配置第一类关键词与待模拟HID设备的类型之间的映射关系。

例如,第一类关键词中的点击、选中、移动、右键、单击、双击、打开及关闭等对应的待模拟HID设备的类型为鼠标,也即此时智能语音输入设备10模拟鼠标。

又如,第一类关键词中的输入、删除等对应的待模拟HID设备的类型为键盘,也即此时智能语音输入设备10模拟键盘。

再如,第一类关键词中的左转、右转、前进、后退等对应的待模拟HID设备的类型为手柄。

在具体实施中,可以预先配置第二类关键词与HID指令的指令内容之间的映射关系。第二类关键词可以根据第一类关键词进行确定,也可以单独确定。具体可以根据智能语音输入设备10待模拟的HID设备的类型进行确定。

在本发明一些实施例中,确定HID指令类型为之后,可以根据第一类关键词附近的词汇确定第二类关键词,进而根据第二类关键词确定HID指令的指令内容。

例如,解析结果为“输入ABC”。第一类关键词为“输入”,确定待模拟的HID设备的类型为键盘。第二类关键词为“ABC”。在生成的HID指令的指令内容中可以包括ABC。

又如,解析结果为“选择ABC”。第一类关键词为“选择”,确定待模拟的HID设备的类型为鼠标。第二类关键词为“ABC”。在生成的HID指令的指令内容中可以包括ABC。

在实际应用中,在一些场景中,存在一语音信号对应的解析结果需要多种类型的HID设备的配合。例如,解析结果为“搜索HID”,此处需要先打开对应的搜索网页,然后在搜索网页的搜索框内输入HID,然后再启动HID的搜索,此时,需要键盘与鼠标的配合。需要说明的是,在实际应用中,在查找某些内容以及其他的一些场景中,可能也需要多种类型的HID设备配合才能实现,并不限上述举例。

为了解决上述问题,在本发明实施例中,在配置第一类关键词与HID设备的类型之间的映射关系时,可以将第一类关键词配置为对应两种及以上的HID设备的类型。

例如,第一类关键词配置为映射键盘和鼠标。

又如,第一类关键词配置为映射键盘和触摸面板。

需要说明的是,以上举例仅为便于理解做出的示意性说明,在实际应用中,上述举例并不限制本发明的实际应用场景以及保护范围。在实际应用中,根据应用场景需求不同,智能语音输入设备10待模拟的HID设备的类型不同,第一关键词、第一关键词与HID设备的类型之间的映射关系、第二类关键词、第二类关键词与指令内容之间的映射关系也不相同,具体根据需求进行设置即可。

所述智能语音输入设备10还可以包括去噪单元,用于对所述语音信号进行去噪处理,以降低语音信号中的噪音,提高后续对语音信号的识别准确度,以提高智能语音输入设备10对应的HID指令的准确度。

在具体实施中,智能语音输入设备10可以通过多种方式连接于终端设备。例如,智能语音输入设备10包括连接端,通过连接端连接于被控的终端设备。又如,智能语音输入设备10包括无线通信模块,通过无线通信模块与终端设备进行通信连接。智能语音输入设备10与终端设备均满足对应的HID协议即可。

本发明实施例还提供一种智能语音输入系统。参照图2,给出了本发明实施例中的一种智能语音输入系统的结构示意图。智能语音输入系统可以包括智能语音输入设备10以及终端设备20。

其中,智能语音输入设备10可以采用本发明上述任一实施例提供的智能语音输入设备10,智能语音输入设备10的具体结构以及工作原理可以参考本发明上述实施例中的智能语音输入设备10的相关描述,此处不做赘述。

在具体实施中,智能语音输入设备10可以将生成的HID指令发送至终端设备20。终端设备20根据HID命令执行对应的操作。其中,终端设备可以包括笔记本电脑、台式电脑、掌上电脑以及手机等。

在本发明一实施例中,终端设备20可以配置有HID接口,智能语音输入设备10可以通过HID接口连接于终端设备20。智能语音输入设备10基于HID协议,将HID指令发送至终端设备20。

在本发明另一些实施例中,终端设备20也可以无须配置HID接口,智能语音输入设备10与终端设备20可以通过WIFI、蓝牙等无线通信方式连接,只需终端设备20与智能语音输入设备10均支持对应的HID协议,二者之间能够进行数据传输即可。

在具体实施中,HID指令可以包括用于指示智能语音输入设备10待模拟的HID设备的类型的指示信息以及指令内容。终端设备20可以根据指示信息指示的待模拟HID设备的类型以及指令内容执行对应的操作。

例如,HID指令中的指示信息指示智能语音输入设备10待模拟的HID设备的类型为键盘,指令内容为“在Word文档中输入ABC”。终端设备20则响应于HID指令在Word文档中输入“ABC”。

又如,HID指令中的指示信息指示智能语音输入设备10待模拟的HID设备的类型为鼠标,指令内容为“在当前页面中选中ABC”。终端设备20则响应于HID指令,在当前页面中查找ABC,选中所查找到的所有ABC,并标示。

在具体实施中,当检测到所述智能语音输入设备10连接至所述终端设备20时,控制所述智能语音输入设备10采集外部的语音信号;控制所述智能语音输入设备10对所述识别结果进行语义解析,并根据解析结果生成HID命令,将所述HID命令发送至终端设备20。

在智能语音输入设备10首次连接于终端设备20时,可以先对智能语音输入设备10进行注册,将智能语音输入设备10注册为待模拟的对应类型的HID设备。也可以在智能语音输入设备10每次连接于终端设备20时,对智能语音输入设备10进行注册,将智能语音输入设备10注册为待模拟的对应类型的HID设备。

具体而言,当检测到智能语音输入设备10连接于终端设备20时,获取智能语音输入设备10的设备注册信息,根据设备注册信息,将智能语音输入设备10注册为对应类型的HID设备。其中,设备注册信息用于智能语音输入设备10的注册,根据智能语音输入设备10待模拟的HID设备不同,设备注册信息不同。

在具体实施中,在将智能语音输入设备10注册为对应类型的HID设备时,可以将智能语音输入设备10注册为一种类型的HID设备,也可以注册为多种类型的HID设备。

在本发明一实施例中,设备注册信息中包括一种类型的HID设备的注册信息时,则根据设备注册信息,将智能语音输入设备10注册为一种类型的HID设备。例如,设备注册信息中仅包括键盘的注册信息,则将智能语音输入设备10注册为键盘。又如,设备注册信息中仅包含鼠标的注册信息,则将智能语音输入设备10注册为鼠标。

在本发明另一实施例中,当设备注册信息中包括多种类型的HID设备的注册信息时,可以根据设备注册信息分别将智能语音输入设备10注册为对应类型的HID设备。

例如,设备注册信息包括键盘的注册信息、鼠标的注册信息及触摸面板的注册信息。根据键盘的注册信息将智能语音输入设备10注册为键盘,根据鼠标的注册信息将智能语音输入设备10注册为鼠标,根据触摸面板的注册信息将智能语音输入设备10注册为触摸面板。此时,将智能语音输入设备10注册为键盘、鼠标以及触摸面板。

当智能语音输入设备10可以被注册为多种类型的HID设备时,后续可以根据语音信号的识别结果,在已注册的多种类型的HID设备中,选择对应类型的HID设备,然后生成与所选择的HID设备的类型相对应的HID指令。

在具体实施中,智能语音输入系统还可以包括云端语音识别服务器30。智能语音输入设备10可以将语音信号发送至云端语音识别服务器30。云端语音识别服务器30可以对语音信号进行识别,得到识别结果,并将识别结果反馈至智能语音输入设备10。

本发明实施例还提供一种智能语音输入系统的控制方法,所述控制方法可以对上述任一实施例提供的智能语音输入系统进行控制。

参照图3,给出了本发明实施例中的一种智能语音输入系统的控制方法的流程图。具体可以包括如下步骤:

步骤S31,当检测到所述智能语音输入设备连接至所述终端设备时,控制所述智能语音输入设备采集外部的语音信号。

在一些实施中,终端设备可以设置有HID接口,智能语音输入设备具有与HID接口对应的连接端。智能语音输入设备上的连接端与终端设备上的HID接口适配,通过HID接口,智能语音输入设备连接于终端设备。在另一些实施例中,终端设备与智能语音输入设备可以通过WIFI、蓝牙等无线通信方式连接,只需终端设备与智能语音输入设备均支持对应的HID协议,二者之间能够进行数据传输即可。

在又一些实施例中,终端设备设置有HID接口,智能语音输入设备具有与HID接口对应的连接端。同时,终端设备以及智能语音输入设备之间也可以通过WIFI、蓝牙等无线通信方式连接,且终端设备与智能语音输入设备均支持对应的HID协议。

当检测到智能语音输入设备连接于终端设备时,可以控制智能语音输入设备采集外部的语音信号。

在一些实施例中,智能语音输入设备可以采用自身配置的语音采集模块采集语音信号。

在另一些实施例中,智能语音输入设备可以复用终端设备上的语音采集模块来采集语音信号,并从终端设备获取终端设备采集的语音信号。

在具体实施中,在智能语音输入设备连接于终端设备时,可以获取智能语音输入设备的设备注册信息。根据设备注册信息可以将智能语音输入设备注册为对应的HID设备。

在根据设备注册信息对智能语音输入设备进行注册时,若设备注册信息包括一种类型HID设备的注册信息时,则将智能语音输入设备注册为一种类型的HID设备。若设备注册信息包括多种类型的HID设备的注册信息时,则根据多种类型的HID设备的注册信息分别将智能语音输入设备注册为对应的多种类型的HID设备。

其中,关于智能语音输入设备的注册的相关描述可以参考本发明上述实施例提供的智能语音输入设备以及系统中的相关描述,此处不再赘述。

步骤S32,控制所述智能语音输入设备对所述语音信号的识别结果进行语义解析,并根据解析结果生成HID命令,将所述HID命令发送至终端设备。

在具体实施中,语音信号的识别结果可以由智能语音输入设备对语音信号进行识别得到。语音信号的识别结果也可以由智能语音输入设备将语音信号发送至云端语音识别服务器,云端语音识别服务器对语音信号进行识别得到识别结果,并将识别结果反馈至智能语音输入设备。

智能语音输入设备对所述语音信号的识别结果进行语义解析,得到解析结果。智能语音输入设备根据解析结果生成HID命令,将HID命令发送至终端设备。在一些实施例中,智能语音输入设备可以基于HID协议,通过HID接口将HID命令发送至终端设备。

其中,HID指令的生成可以参照本发明上述实施例提供的智能语音输入设备以及智能语音输入系统中的相关描述,此处不再赘述。

由上述方案可知,通过智能语音输入设备可以将采集的语音信号转换成对应的HID指令,并将HID指令发送至被控的终端设备,以实现对终端设备的控制。实现通过语音信号对终端设备的控制。

此外,基于采集的语音信号确定智能语音输入设备待模拟的HID设备的类型,并可以基于不同的语音信号使得智能语音输入设备在不同类型的HID之间切换,可以实现智能语音输入设备的通用性。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于任一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号