首页> 外国专利> SYSTEMS AND METHODS FOR PRINCIPLED BIAS REDUCTION IN PRODUCTION SPEECH MODELS

SYSTEMS AND METHODS FOR PRINCIPLED BIAS REDUCTION IN PRODUCTION SPEECH MODELS

机译：生产语音模型中主要偏倚减少的系统和方法

页面导航

摘要
著录项
相似文献

摘要

Described herein are systems and methods to identify and address sources of bias in an end-to-end speech model. In one or more embodiments, the end-to-end model may be a recurrent neural network with two 2D-convolutional input layers, followed by multiple bidirectional recurrent layers and one fully connected layer before a softmax layer. In one or more embodiments, the network is trained end-to-end using the CTC loss function to directly predict sequences of characters from log spectrograms of audio. With optimized recurrent layers and training together with alignment information, some unwanted bias induced by using purely forward only recurrences may be removed in a deployed model.

机译：本文描述了用于识别和解决端到端语音模型中的偏见源的系统和方法。在一个或多个实施例中，端到端模型可以是具有两个2D卷积输入层，其后是多个双向递归层和在softmax层之前的一个完全连接层的递归神经网络。在一个或多个实施例中，使用CTC损失功能对网络进行端到端训练，以直接从音频的对数频谱图预测字符序列。通过优化的递归层和训练以及对齐信息，可以在部署的模型中消除由于仅使用正向递归导致的一些不希望的偏差。

著录项

公开/公告号US2018247643A1

专利类型
公开/公告日2018-08-30

原文格式PDF
申请/专利权人 BAIDU USA LLC;
展开▼

申请/专利号US201815884239
发明设计人 ERIC BATTENBERG;REWON CHILD;ADAM COATES;CHRISTOPHER FOUGNER;YASHESH GAUR;JIAJI HUANG;HEEWOO JUN;AJAY KANNAN;MARKUS KLIEGL;ATUL KUMAR;HAIRONG LIU;VINAY RAO;SANJEEV SATHEESH;DAVID SEETAPUN;ANUROOP SRIRAM;ZHENYAO ZHU;
展开▼

申请日2018-01-30
分类号G10L15/16;G10L15/22;G10L15/04;G10L25/18;
国家 US
入库时间 2022-08-21 12:57:10

相似文献

专利
外文文献
中文文献