首页> 中国专利> 声源定位模型的训练与声源定位方法、装置

声源定位模型的训练与声源定位方法、装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本公开提供了一种声源定位模型的训练与声源定位方法，涉及语音处理、深度学习等人工智能技术领域。声源定位模型的训练方法包括：根据包含唤醒词的音频信号得到样本音频；提取样本音频中至少一个音频帧的音频特征，标注至少一个音频帧的方向标签与掩码标签；使用至少一个音频帧的音频特征、方向标签与掩码标签对神经网络模型进行训练，得到声源定位模型。声源定位方法包括：获取待处理音频信号，提取待处理音频信号中每个音频帧的音频特征；将每个音频帧的音频特征输入声源定位模型，得到声源定位模型针对每个音频帧输出的声源方向信息；确定待处理音频信号中的唤醒词尾点帧；根据对应唤醒词尾点帧的声源方向信息得到待处理音频信号的声源方向。

著录项

公开/公告号CN113903334A

专利类型发明专利
公开/公告日2022-01-07

原文格式PDF
申请/专利权人北京百度网讯科技有限公司;
展开▼

申请/专利号CN202111068636.6
发明设计人都伟;邹赛赛;杜腾宇;
展开▼

申请日2021-09-13
分类号G10L15/22(20060101);G10L15/02(20060101);G10L15/05(20130101);G10L15/06(20130101);G10L15/16(20060101);
代理机构11412 北京鸿德海业知识产权代理有限公司;
代理人田宏宾
地址 100085 北京市海淀区上地十街10号百度大厦2层
入库时间 2023-06-19 13:33:57

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-23

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 声源定位模型的训练与声源定位方法、装置 [P] . 中国专利： CN113903334A . 2022-01-07
2. 一种声源定位方法、声源定位装置及车辆 [P] . 中国专利： CN109490834A . 2019-03-19
3. Multi-cantilever MEMS sensor, manufacturing method thereof, sound source localization apparatus using the multi-cantilever MEMS sensor, sound source localization method using the sound source localization apparatus [P] . 美国专利： US7944130B2 . 2011-05-17

机译：多悬臂MEMS传感器，其制造方法，使用该多悬臂MEMS传感器的声源定位装置，使用该声源定位装置的声源定位方法
4. SOUND SOURCE LOCALIZATION DEVICE, SOUND PROCESSING SYSTEM, AND CONTROL METHOD OF SOUND SOURCE LOCALIZATION DEVICE [P] . 美国专利： US2016212525A1 . 2016-07-21

机译：声源定位装置，声处理系统以及声源定位装置的控制方法
5. Sound source localization device, sound source localization method, and program [P] . 日本专利： JP2020141222A . 2020-09-03

机译：声源定位装置，声源定位方法及程序