首页> 外国专利> Acoustic Based Speech Analysis Using Deep Learning Models

Acoustic Based Speech Analysis Using Deep Learning Models

机译:基于声学的语音分析,深入学习模型

摘要

A method and system for detecting one or more speech features in speech audio data includes receiving speech audio data, performing preprocessing on the speech audio data to prepare the speech audio data for use as an input into one or more models that detect one or more speech features, providing the preprocessed speech audio data to a stacked machine learning model, and analyzing the preprocessed speech audio data via the stacked ML model to detect the one or more speech features. The stacked ML model includes a feature aggregation model, a sequence to sequence model, and a decision-making model.
机译:用于检测语音音频数据中的一个或多个语音特征的方法和系统包括接收语音音频数据,在语音音频数据上执行预处理以准备语音音频数据,以用作检测一个或多个语音的一个或多个模型中的输入特征,将预处理的语音音频数据提供给堆叠的机器学习模型,并经由堆叠的ML模型分析预处理的语音音频数据以检测一个或多个语音特征。堆叠的ML模型包括特征聚合模型,序列模型的序列和决策模型。

著录项

  • 公开/公告号US2021118426A1

    专利类型

  • 公开/公告日2021-04-22

    原文格式PDF

  • 申请/专利权人 MICROSOFT TECHNOLOGY LICENSING LLC;

    申请/专利号US201916710442

  • 发明设计人 JI LI;AMIT SRIVASTAVA;

    申请日2019-12-11

  • 分类号G10L15/06;G10L15/02;G10L15/22;G10L15/18;G10L15/04;G10L25/90;G10L25/24;G10L25/18;G06N3/04;G06N3/08;

  • 国家 US

  • 入库时间 2022-08-24 18:19:44

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号