首页> 外国专利> PERCEPTUALLY-BASED LOSS FUNCTIONS FOR AUDIO ENCODING AND DECODING BASED ON MACHINE LEARNING

PERCEPTUALLY-BASED LOSS FUNCTIONS FOR AUDIO ENCODING AND DECODING BASED ON MACHINE LEARNING

机译：基于机器学习的音频编码和解码的基于感知的损失函数

页面导航

摘要
著录项
相似文献

摘要

Computer-implemented methods for training a neural network, as well as for implementing audio encoders and decoders via trained neural networks, are provided. The neural network may receive an input audio signal, generate an encoded audio signal and decode the encoded audio signal. A loss function generating module may receive the decoded audio signal and a ground truth audio signal, and may generate a loss function value corresponding to the decoded audio signal. Generating the loss function value may involve applying a psychoacoustic model. The neural network may be trained based on the loss function value. The training may involve updating at least one weight of the neural network.

机译：提供了用于训练神经网络以及用于通过训练的神经网络来实现音频编码器和解码器的计算机实现的方法。神经网络可以接收输入音频信号，生成编码的音频信号并且对编码的音频信号进行解码。损失函数生成模块可以接收解码的音频信号和地面真实音频信号，并且可以生成与解码的音频信号相对应的损失函数值。生成损失函数值可能涉及应用心理声学模型。可以基于损失函数值来训练神经网络。训练可以涉及更新神经网络的至少一个权重。

著录项

公开/公告号WO2019199995A1

专利类型
公开/公告日2019-10-17

原文格式PDF
申请/专利权人 DOLBY LABORATORIES LICENSING CORPORATION;
展开▼

申请/专利号WO2019US26824
发明设计人 FEJGIN ROY M.;DAVIDSON GRANT A.;WU CHIH-WEI;KUMAR VIVEK;
展开▼

申请日2019-04-10
分类号G01L19;G10L25/30;
国家 WO
入库时间 2022-08-21 11:52:44

相似文献

专利
外文文献
中文文献