首页> 中国专利> 多人对话语音实时翻译方法、装置、设备及存储介质

多人对话语音实时翻译方法、装置、设备及存储介质

摘要

本申请实施例属于语音处理技术领域,涉及一种多人对话语音实时翻译方法、装置、计算机设备及存储介质,其中方法包括:接收待翻译的对话语音,将所述对话语音输入到预设的语音分离模型进行语音分离,得到N个子音频;将所述子音频通过ASR算法进行语音识别,得到所述子音频对应的文本;将所述子音频对应的文本输入到预设的翻译引擎进行翻译,得到所述子音频对应的目标语言翻译结果。对话语音包含多个人声,使AI实时翻译的应用场景可扩大到日常的交流、会议;其次,先对分离的子音频进行语音识别,获得对应的文本,再以文本为基准进行目标语言的转换,不会出现漏翻的情况,且相对与直接使用音频进行目标语言的转换,处理起来更简便更准确。

著录项

  • 公开/公告号CN113505612A

    专利类型发明专利

  • 公开/公告日2021-10-15

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN202110835277.6

  • 发明设计人 卢春曦;王健宗;

    申请日2021-07-23

  • 分类号G06F40/58(20200101);G06F40/289(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);G10L15/00(20130101);G10L15/06(20130101);G10L15/16(20060101);G10L15/26(20060101);G10L21/0272(20130101);

  • 代理机构44385 深圳市世联合知识产权代理有限公司;

  • 代理人汪琳琳

  • 地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

  • 入库时间 2023-06-19 12:53:05

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号