公开/公告号CN112992131A
专利类型发明专利
公开/公告日2021-06-18
原文格式PDF
申请/专利权人 南京邮电大学;
申请/专利号CN202110155034.8
申请日2021-02-04
分类号G10L15/20(20060101);G10L15/22(20060101);G10L15/26(20060101);G10L21/0208(20130101);G10L21/0272(20130101);G10L17/00(20130101);G10L17/22(20130101);
代理机构32224 南京纵横知识产权代理有限公司;
代理人韩红莉
地址 210012 江苏省南京市雨花台区宁双路19号
入库时间 2023-06-19 11:27:38
技术领域
本发明涉及一种在复杂场景下提取目标人声的乒乓球指令的方法,属于远场语音识别技术领域。
背景技术
随着社会的快速发展,人们的生活方式也越来越多样化和智能化。在乒乓球训练上,传统的训练方式都是寻找一个陪练,再寻找一个教练。在与陪练训练的同时,教练在旁边观察你的打球方式,以便发现你身上存在的问题,来进行针对性的训练。这种传统的训练方式耗费大量的人力和钱财,而且训练的效果还不好。以此我们提出了更加智能的乒乓球训练方式。采用语音控制的乒乓球发球机。常规的乒乓球发球机都是采用遥控器控制的,并不是非常的智能。为此我们破解了遥控器,使用语音来对发球机控制。遥控器所拥有的功能,语音控制都能完成。在语音控制上,我们必须准确的识别用户所发出的乒乓球指令,然而在进行乒乓球训练时,所处的环境并不是安静的。而是一个非常复杂的环境,包括乒乓球发球机自己的噪声,乒乓球落地之后乒乒乓乓的声音,最严重的干扰还是其他不同人说话的声音。众多的声音混杂在一起,使得想要准确的识别用户所发出的指令变得异常困难,即使提取出来,也有可能不是完整的指令集,导致乒乓球发球机不能正常的工作。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种在复杂场景下提取目标人声的乒乓球指令的方法。
为达到上述目的,本发明提供一种在复杂场景下提取目标人声的乒乓球指令的方法,包括以下步骤:
语音采集设备在乒乓球馆实时采集以打乒乓球为背景的噪声信号,采集到的噪声信号包含不同人说话的声音、环境噪声和乒乓球碰撞的声音;
为分析采集到的噪声信号,对噪声信号进行建模仿真处理,分析噪声信号的统计特性,建立乒乓球训练背景下的噪声信号模型,去除噪声信号中的环境噪声,只保留不同人说话的声音;
采用声纹提取模块对训练人员的声音进行采集,记录下每个训练人员的声音特征;
设定乒乓球发球机指令,乒乓球发球机指令包括乒乓球发球机的发球指令、乒乓球发球机的关机指令、乒乓球发球机的唤醒指令和乒乓球发球机的开机指令;
实时重复采集噪声信号,基于噪声信号模型来去除噪声信号中的乒乓球碰撞的声音,只保留不同人说话的声音;
不同人说话的声音与记录的训练人员的声音特征对比并判断是否有相互匹配的,有匹配的则识别不同人说话的声音中是否有乒乓球发球机指令,如果有乒乓球发球机指令则乒乓球发球机执行相应动作。
优先地,由于输入的噪声信号是不平稳的,采用噪声估计法处理非平稳的噪声信号,公式如下:
其中,λ表示帧数,k表示频点索引,Y表示频域的带噪语音谱,σ表示噪声谱,α表示平滑因子,平滑因是固定值;
为了区别不同人的声音,利用不同人的语音特征MFCC的不同来判断,记录不同人的声纹特征,提取过程如下:
预加重处理:将语音信号通过一个高通滤波器进行滤波处理:
H(z)=1-μz
其中,μ为常量,z是高通滤波器的自变量;
分帧先将N个噪声信号集合成一个观测单位,称为帧;
加窗:将每帧乘以一个汉明窗,以增加帧左端和帧右端的连续性;
机译: 基于复杂场景下深度图的红外小目标检测方法
机译: 利用单个指令提取来执行分支指令和相关目标指令的处理器和方法
机译: 细菌;重组细菌;细菌的无细胞提取物;细菌的至少一种核酸序列的用途;重组微生物至少两种不同微生物的共培养;使用细菌或提取物;生产目标化合物的方法;将底物生物转化为目标物质的方法;生产还原分子的方法;食物供给;和化妆品成分