公开/公告号CN107731222A
专利类型发明专利
公开/公告日2018-02-23
原文格式PDF
申请/专利权人 安徽咪鼠科技有限公司;
申请/专利号CN201710947346.6
申请日2017-10-12
分类号
代理机构北京和信华成知识产权代理事务所(普通合伙);
代理人胡剑辉
地址 230000 安徽省合肥市高新区习友路3333号中国(合肥)国际智能语音产业园研发中心楼
入库时间 2023-06-19 04:40:01
法律状态公告日
法律状态信息
法律状态
2020-06-30
授权
授权
2018-03-20
实质审查的生效 IPC(主分类):G10L15/04 申请日:20171012
实质审查的生效
2018-02-23
公开
公开
技术领域
本发明属于语音识别技术领域,涉及一种延长语音识别延续时间的方法,具体是一种延长智能语音鼠标语音识别延续时间的方法。
背景技术
智能语音鼠标工作时,需要将采集到的音频数据上传到讯飞语音识别服务器进行语音识别工作。然而,讯飞语音服务器的语音识别延续时间是1分钟,只支持1分钟的连续语音识别时间,超过1分钟就提示超时,无法进行识别,连续的语音识别就断开了,大大影响了智能语音鼠标的工作效果和稳定性。
发明内容
本发明的目的在于提供一种延长智能语音鼠标语音识别延续时间的方法。
本发明的目的可以通过以下技术方案实现:
一种延长智能语音鼠标语音识别延续时间的方法,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块;
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数;
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号;
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号;
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器。
本发明的有益效果:本发明提供的延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,提示程序重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种延长智能语音鼠标语音识别延续时间的方法,包括以下步骤:
步骤S1,智能语音鼠标通过其内置的高性能麦克风采集到用户说话的音频数据,并将音频数据划分为若干音频块。
步骤S2,智能语音鼠标将音频块上传到讯飞语音识别服务器,并对上传到讯飞语音识别服务器的音频块进行计数。
步骤S3,当上传的音频块个数达到音频第55秒的音频块数时,发出寻找静音音频块的信号,开始寻找静音音频块;其中,静音音频块为不包含任何声音数据的音频块。
步骤S4,若在音频第59秒之内找到静音音频块,在将静音音频块上传到讯飞语音识别服务器时,发出重新连接服务器信号。
步骤S5,若在音频第59秒之内没有找到静音音频块,在上传的音频块个数达到音频第59秒的音频块数时,强制发出重新连接服务器信号。
步骤S6,智能语音鼠标根据重新连接服务器信号,重新连接到讯飞语音识别服务器,避免因语音识别超时而导致连续的语音识别断开。
本发明提供的延长智能语音鼠标语音识别延续时间的方法,通过记录上传到讯飞语音识别服务器的音频块块数,计算出送到讯飞语音识别服务器的音频延续时间,在时间接近1分钟时,提示程序重新连接到服务器,后续的音频块就可以重新上传到讯飞语音识别服务器进行识别,避免因语音识别超时而导致连续的语音识别断开,保证智能语音鼠标的工作效果和稳定性。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
机译: 为语音识别设备提供智能语音识别模型的方法
机译: 智能语音识别方法,语音识别装置,智能计算设备和服务器
机译: 智能语音识别方法,具有改进的噪声消除,语音识别装置,智能计算设备和服务器