首页> 外国专利> SPEECH RECOGNITION SYSTEM USING MACHINE LEARNING TO CLASSIFY PHONE POSTERIOR CONTEXT INFORMATION AND ESTIMATE BOUNDARIES IN SPEECH FROM COMBINED BOUNDARY POSTERIORS

SPEECH RECOGNITION SYSTEM USING MACHINE LEARNING TO CLASSIFY PHONE POSTERIOR CONTEXT INFORMATION AND ESTIMATE BOUNDARIES IN SPEECH FROM COMBINED BOUNDARY POSTERIORS

机译:基于机器学习的语音识别系统,用于分类语音后境信息和组合边界后语音中的边界

摘要

A speech recognition system includes a phone classifier and a boundary classifier. The phone classifier generates combined boundary posteriors from a combination of auditory attention features and phone posteriors by feeding phone posteriors of neighboring frames of an audio signal into a machine learning algorithm to classify phone posterior context information. The boundary classifier estimates boundaries in speech contained in the audio signal from the combined boundary posteriors.
机译:语音识别系统包括电话分类器和边界分类器。电话分类器通过将音频信号的相邻帧的电话后方输入到机器学习算法中以将电话后上下文信息分类来从听觉注意力特征和电话后方的组合生成组合的边界后方。边界分类器从组合边界后验估计音频信号中包含的语音中的边界。

著录项

  • 公开/公告号US2019005943A1

    专利类型

  • 公开/公告日2019-01-03

    原文格式PDF

  • 申请/专利权人 SONY INTERACTIVE ENTERTAINMENT LLC;

    申请/专利号US201816103251

  • 发明设计人 OZLEM KALINLI-AKBACAK;

    申请日2018-08-14

  • 分类号G10L15/04;G10L25/03;G10L15/16;G10L25/30;

  • 国家 US

  • 入库时间 2022-08-21 12:06:14

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号