首页> 中国专利> 一种基于声音与图像融合的发言者定位方法

一种基于声音与图像融合的发言者定位方法

页面导航

摘要
著录项
相似文献

摘要

本发明提供一种基于声音与图像融合的发言者定位方法，可以精准的定位发言者，并且平滑的切换到发言者区域特写图像。本发明包括如下步骤：步骤一、基于麦克风阵列来实现声源定位;步骤二、基于改进的YOLO V3神经网络来实现人脸检测;步骤三、设置2个变倍摄像头与1个定焦摄像头，并通过步骤一的声源定位和步骤二的人脸检测来定位发言者，2个变倍摄像头定义为摄像机一与摄像机二。

著录项

公开/公告号CN111046850B

专利类型发明专利
公开/公告日2021-04-06

原文格式PDF
申请/专利权人杭州晨安科技股份有限公司;
展开▼

申请/专利号CN201911406105.6
发明设计人王全强;刘红艳;毛海滨;
展开▼

申请日2019-12-31
分类号G06K9/00(20060101);G01S5/18(20060101);H04N7/18(20060101);G06N3/04(20060101);
代理机构33209 杭州天欣专利事务所(普通合伙);
代理人梁斌
地址 310030 浙江省杭州市西湖区三墩镇西湖科技园西园一路16号4幢4层
入库时间 2022-08-23 11:37:50

相似文献

专利
中文文献
外文文献

1. 一种基于声音与图像融合的发言者定位方法 [P] . 中国专利： CN111046850B . 2021.04.06
2. 一种基于时差定位的声音定位方法及设备 [P] . 中国专利： CN111448471A . 2020-07-24
3. SOUND IMAGE POSITIONING ESTIMATION DEVICE, SOUND IMAGE POSITIONING ESTIMATION CONTROL SYSTEM, SOUND IMAGE POSITIONING METHOD, AND SOUND IMAGE POSITIONING CONTROL METHOD [P] . 世界知识产权组织专利： WO2009025023A1 . 2009-02-26

机译：声音图像定位估计装置，声音图像定位估计控制系统，声音图像定位方法和声音图像定位控制方法
4. MULTI IMAGE FUSION BASED POSITIONING VERIFICATION [P] . 欧洲知识产权局专利： EP3461296B1 . 2020-09-16

机译：基于多图像融合的定位验证
5. MULTI IMAGE FUSION BASED POSITIONING VERIFICATION [P] . 美国专利： US2019156478A1 . 2019-05-23

机译：基于多图像融合的定位验证