首页> 外国专利> SYSTEM AND METHOD FOR IMPROVING SPEAKER SEGMENTATION AND RECOGNITION ACCURACY IN A MEDIA PROCESSING ENVIRONMENT

SYSTEM AND METHOD FOR IMPROVING SPEAKER SEGMENTATION AND RECOGNITION ACCURACY IN A MEDIA PROCESSING ENVIRONMENT

机译：在媒体处理环境中提高扬声器的分割和识别精度的系统和方法

页面导航

摘要
著录项
相似文献

摘要

A method is provided and includes estimating an approximate list of potential speakers in a file from one or more applications. The file (e.g., an audio file, video file, or any suitable combination thereof) includes a recording of a plurality of speakers. The method also includes segmenting the file according to the approximate list of potential speakers such that each segment corresponds to at least one speaker; and recognizing particular speakers in the file based on the approximate list of potential speakers.

机译：提供了一种方法，该方法包括估计来自一个或多个应用程序的文件中的潜在讲话者的近似列表。该文件（例如，音频文件，视频文件或其任何合适的组合）包括多个扬声器的录音。该方法还包括根据潜在讲话者的近似列表对文件进行分段，使得每个分段对应于至少一个讲话者;并根据潜在讲话者的近似列表识别文件中的特定讲话者。

著录项

公开/公告号US2014074471A1

专利类型
公开/公告日2014-03-13

原文格式PDF
申请/专利权人 ANANTH SANKAR;SACHIN KAJAREKAR;SATISH K. GANNU;
展开▼

申请/专利号US201213608420
发明设计人 SACHIN KAJAREKAR;SATISH K. GANNU;ANANTH SANKAR;
展开▼

申请日2012-09-10
分类号G10L17/00;
国家 US
入库时间 2022-08-21 16:08:46

相似文献

专利
外文文献
中文文献