首页> 中国专利> 一种基于统一表征的关键词检索方法

一种基于统一表征的关键词检索方法

摘要

本发明属于语音信号处理技术领域,尤其涉及一种基于统一表征的关键词检索方法,包括:采用大量语音数据训练带有瓶颈层的神经网络语音自编码器得到声学表征矢量提取器;采用大量文本数据训练带有瓶颈层的神经网络文本自编码器得到语言表征矢量提取器;采用大量语音数据片段和对应的文本数据片段分别提取对应的声学表征矢量和语言表征矢量用于训练统一矢量提取器;通过语言表征矢量提取器和统一矢量提取器得到文本关键词的查询矢量;通过声学表征矢量提取器和统一矢量提取器得到语音关键词的查询矢量;对于待查询语音,分段依次通过声学表征矢量提取器和统一矢量提取器得到多个索引矢量并计算与查询矢量的距离,若小于预设门限即认为命中查询词。

著录项

  • 公开/公告号CN110738987B

    专利类型发明专利

  • 公开/公告日2022-02-15

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN201910992852.6

  • 发明设计人 张卫强;

    申请日2019-10-18

  • 分类号G10L15/08(20060101);G10L15/02(20060101);G10L15/26(20060101);G10L19/00(20130101);G10L19/038(20130101);G10L25/30(20130101);G06F16/68(20190101);

  • 代理机构11246 北京众合诚成知识产权代理有限公司;

  • 代理人史双元

  • 地址 100084 北京市海淀区清华大学

  • 入库时间 2022-08-23 13:07:07

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号