深度自编码网络特征提取实现基于超声的无声语音识别

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

无声语音交流是指在没有发出声音的情况下，仅通过声道发声器官的运动就能判断对方想要表达的内容并进行反馈，最常见的就是唇语。对于后天发音障碍患者，无声语音识别和合成系统能有效解决他们交流的问题。在这种情况下，无声语音接口（SilentSpeech Interface,SSI）应运而生，它是一种基于非声学信号捕获的，在安静或嘈杂环境中提供安全可靠语音通信的系统。目前非声学信号的采集解决方案有超声舌头成像和视频嘴唇图像、面部放置的肌电信号传感器以及贴于发音器官如唇、齿、舌表面的电磁发音仪线圈传感器等。本文采用基于超声成像和视频图像的SSI，建立了一套无声语音识别系统，实现了从无声信号到文本结果的转换。
　　近年来，随着深度神经网络（DeepNeural Network,DNN）的提出与发展，传统语音识别借助该技术在识别率上有了非常明显的提高。本文首次提出将DNN技术应用于基于超声成像的SSI中，对比基准系统识别率有了较大提高。识别系统主要分为两部分：非声学特征提取和语音识别。在非声学特征提取中，不同于以往线性变换方法，本文采用基于深度学习的自编码网络（Autoencoder）实现数据降维并提取特征，重构效果优于离散余弦变换（Discrete Cosine Transform,DCT）；将提取的非声学特征作为输入，训练DNN-HMM模型，解码得到无声语音识别文本，识别率较对比基准有较大提高，同时基于自编码网络提取的深层特征也在识别率及信息压缩方面体现出了相对传统线性方法的优越性。目前，Autoencoder特征也加入了Silent Speech Challenge数据库中，成为基于超声成像SSI的新一种非声学特征。
　　随着移动计算的飞速发展，以无声语音识别为核心引擎的SSI的应用前景将越来越广阔。在实现无声语音实时在线识别后，无声语音信号采集装置可以集成在移动设备中，实现公共场合私密通话、安静场所无声交流等非常实用的功能。此外，还可以通过分析发音器官运动信息，向人们提供健康监测数据和专业分析报告，成为时下热门的可穿戴式健康监测设备。

著录项

作者
刘立成;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科计算机科学与技术
授予学位硕士
导师姓名本多清志;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
无声语音接口; 无声语音识别; 超声成像; 深度神经网络; 自编码网络; 特征提取;

相似文献

中文文献
外文文献
专利

1. 基于深度自编码网络语音识别噪声鲁棒性研究 [J] . 黄丽霞 ,王亚楠 ,张雪英 . 计算机工程与应用 . 2017,第013期
2. 基于EMG信号的无声语音识别应用及实现 [J] . 许佳佳 ,姚晓东 . 计算机与数字工程 . 2006,第005期
3. 基于稀疏自动编码器的深度神经网络实现 [J] . 张光建 . 现代计算机（专业版） . 2017,第035期
4. 基于稀疏自动编码器的深度神经网络实现 [J] . 张光建 . 现代计算机：上半月版 . 2017,第012期
5. 基于深度自编码器的数字化输电线路地形特征提取方法研究 [J] . 卢诗华 ,孙密 ,谢景海 . 电测与仪表 . 2021,第007期
6. 用于无声语音接口的超声图像的混合特征提取 [C] . LU Wenhuan ,路文焕 ,QU Yuexin . 第十三届全国人机语音通讯学术会议 . 2015
7. 基于深度自编码网络的软件缺陷预测方法与实现 [A] . 周末 . 2018

深度自编码网络特征提取实现基于超声的无声语音识别

目录

摘要

著录项

相似文献

相关主题

期刊订阅