采用注意力机制和多任务训练的端到端无语音识别关键词检索系统

赵泽宇; 张卫强; 刘加

首页> 中文期刊> 《信号处理》 >采用注意力机制和多任务训练的端到端无语音识别关键词检索系统

采用注意力机制和多任务训练的端到端无语音识别关键词检索系统

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

传统的关键词搜索(KWS,Keyword Search)系统依靠自动语音识别(ASR,Automatic Speech Recognition),通常在资源不足的情况下很难训练.为了免去训练完整的语音识别系统,无语音识别(ASR-free)的关键词检索系统受到越来越多的欢迎.本文提出了一个端到端(E2E,End-to-End)的关键词检索系统,该系统由两个编码器,两个解码器,一个注意机制和一个判别器组成.本文在所提出的系统中引入了注意力机制,该机制可以合并编码器输出的文本和音频特征从而辅助定位关键词所在的位置.在文本和音频解码器的不同组合情况下,使用Babel阿萨姆语和普什图语数据集测试系统.实验结果表明,相比于基线系统而言,该系统拥有更好的检测性能.相比于基于语音识别的关键词检索系统,该系统对于集外词(OOV,Out-Of-Vocabulary),在STWV(Supremum Term Weighted Value)指标上,取得了更好的效果.当训练数据量受限时,该系统比基于语音识别的关键词检索系统更具有优势.

著录项

来源
《信号处理》 |2020年第6期|839-851|共13页
作者
赵泽宇; 张卫强; 刘加;
展开▼
作者单位

清华大学电子工程系北京国家信息科学技术研究中心北京100084;

清华大学电子工程系北京国家信息科学技术研究中心北京100084;

清华大学电子工程系北京国家信息科学技术研究中心北京100084;

展开▼
原文格式 PDF
正文语种 chi
中图分类电声技术和语音信号处理;
关键词
检索; 语音识别; 端到端; 低资源语种;

相似文献

中文文献
外文文献
专利

1. 基于端到端语音识别的关键词检索技术研究 [J] . 杨润延 ,程高峰 ,刘建 . 计算机科学 . 2022,第1期
2. 基于多任务学习的端到端维吾尔语语音识别 [J] . 苏比·艾依提 ,努尔麦麦提·尤鲁瓦斯 ,黄浩 . 信号处理 . 2021,第010期
3. 基于双向长短时记忆-联结时序分类和加权有限状态转换器的端到端中文语音识别系统 [J] . 姚煜 ,RYAD Chellali . 计算机应用 . 2018,第009期
4. T-STAM:基于双流时空注意力机制的端到端的动作识别模型 [J] . 石祥滨 ,李怡颖 ,刘芳 . 计算机应用研究 . 2021,第004期
5. 基于注意力机制的联合监督端到端说话人识别模型 [J] . 史王雷 ,冯爽 . 信息与电脑 . 2020,第004期
6. 东巴经"有词无字"现象浅析——以《请神压端鬼·端鬼的来历》为例 [C] . 常丽丽 . 2013全国博士生论坛——出土文献语言文字研究与比较文字学研究领域 . 2013
7. 基于自注意力机制的端到端语音识别方法研究 [A] . 雷志超 . 2020

采用注意力机制和多任务训练的端到端无语音识别关键词检索系统

摘要

著录项

相似文献

相关主题

期刊订阅