首页> 外国专利> AUDIO ENHANCEMENT THROUGH SUPERVISED LATENT VARIABLE REPRESENTATION OF TARGET SPEECH AND NOISE

AUDIO ENHANCEMENT THROUGH SUPERVISED LATENT VARIABLE REPRESENTATION OF TARGET SPEECH AND NOISE

机译：通过监督目标语音和噪声的可变变量表示来增强音频

页面导航

摘要
著录项
相似文献

摘要

Systems and methods for generating an enhanced audio signal comprise a trained neural network configured to receive an input audio signal and generate an enhanced target signal, the trained neural network comprising a pre-processing neural network configured to receive a segment of the input audio signal and output an audio classification, the pre-processing neural network including at least one hidden layer comprising an embedding vector, and a noise reduction neural network configured to receive the segment of the input audio signal, and the embedding vector and generate the enhanced target signal. The pre-processing neural network may comprise a target signal pre-processing neural network configured to output a target signal classification and comprising at least one hidden layer comprising a target embedding vector. The pre-processing neural network may comprise a noise pre-processing neural network configured output a noise classification and comprising at least one hidden layer comprising a noise embedding vector.

机译：用于产生增强音频信号的系统和方法包括配置成接收输入音频信号并生成增强目标信号的训练神经网络，该训练神经网络包括配置成接收输入音频信号的一部分的预处理神经网络，以及输出音频分类，该预处理神经网络包括至少一个包含嵌入向量的隐藏层，以及降噪神经网络，其被配置为接收输入音频信号的片段和嵌入向量并生成增强目标信号。预处理神经网络可以包括目标信号预处理神经网络，该目标信号预处理神经网络被配置为输出目标信号分类并且包括至少一个包含目标嵌入矢量的隐藏层。预处理神经网络可以包括被配置为输出噪声分类并且包括至少一个包括噪声嵌入向量的隐藏层的噪声预处理神经网络。

著录项

公开/公告号US2020349965A1

专利类型
公开/公告日2020-11-05

原文格式PDF
申请/专利权人 FRANCESCO NESTA;MINJE KIM;SANNA WAGER;
展开▼

申请/专利号US202016865111
发明设计人 FRANCESCO NESTA;MINJE KIM;SANNA WAGER;
展开▼

申请日2020-05-01
分类号G10L21/0264;G06N3/08;G10L21/0216;
国家 US
入库时间 2022-08-21 11:21:17

相似文献

专利
外文文献
中文文献