首页> 中国专利> 一种基于长短期记忆模型的人声分割方法及系统

一种基于长短期记忆模型的人声分割方法及系统

摘要

本发明实施例公开了一种基于长短期记忆模型的人声分割方法及系统,解决了现有的技术中,递归神经网络在处理过长的输入序列时,新的信息会覆盖旧的信息,导致的产生被动遗忘的技术问题。其中方法包括:S1、获取待分割音频,按照第一预设步长和第一预设语音窗长度依次提取所述待分割音频片段的第一声学特征向量;S2、将所述第一声学特征向量依次输入至已训练的长短期记忆模型神经网络中,逐一得到所述第一声学特征向量的d‑vector特征矢量;S3、将所述d‑vector特征矢量转换为第一标签值,并将所述第一标签值之间的差值在预设阈值之内的所述d‑vector对应的待分割音频片段按照时间顺序拼接,得到分割后的单通道人声音频文件。

著录项

  • 公开/公告号CN108257592A

    专利类型发明专利

  • 公开/公告日2018-07-06

    原文格式PDF

  • 申请/专利权人 广州势必可赢网络科技有限公司;

    申请/专利号CN201810026363.0

  • 发明设计人 郑渊中;

    申请日2018-01-11

  • 分类号G10L15/04(20130101);G10L15/02(20060101);G10L15/05(20130101);G10L15/06(20130101);G10L19/038(20130101);G10L25/30(20130101);

  • 代理机构44285 深圳市深佳知识产权代理事务所(普通合伙);

  • 代理人王仲凯

  • 地址 510000 广东省广州市天河区科韵路12号之一整栋(部位:705)

  • 入库时间 2023-06-19 05:49:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-07-31

    实质审查的生效 IPC(主分类):G10L15/04 申请日:20180111

    实质审查的生效

  • 2018-07-06

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号