...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声の構造的表象を用いた雑音環境下における日本語母音系列の自動認識
【24h】

音声の構造的表象を用いた雑音環境下における日本語母音系列の自動認識

机译:使用语音的结构表示,在嘈杂的环境中自动识别日语元音序列

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

音声には話者の声道形状の特性,音響機器の特性などの非言語的特徴が不可避的に混入するが,近年,これらを表現する次元を原理的に保有しない音響的普遍構造が提案されている.これは,音声事象の物理的実体を捨象し,関係のみを捉えることによって得られる音声の構造的表象である.本稿では,まず雑音環境下での音響的普遍構造に関する分析実験を行なった.その結果,加算性雑音によって音響的普遍構造の形状が歪むものの,スペクトル高域成分を均一化させることで,話者性がさらに消失されることが示された.次に,加算性雑音下での日本語母音系列の認識実験を行ない,雑音下で学習した学習話者1名の提案手法が,SS (Spectral Subtraction)及びCMN (Cepstral Mean Normalization)を用いた学習話者4,130名の従来手法を上回る結果が得られた.
机译:非言语特征(例如扬声器的语音路径形状的特征和声学设备的特征)不可避免地混入了语音中,但是近年来,已经提出了不具有表达这些特征的尺寸的声学通用结构。 ing。这是通过丢弃语音事件的物理实体并仅捕获关系而获得的语音的结构表示。在本文中,我们首先对嘈杂环境中的声学通用结构进行了分析实验。结果表明,尽管声学通用结构的形状由于附加噪声而失真,但是通过使频谱的高频分量均匀化,扬声器的性能进一步丧失。接下来,我们在加性噪声下进行了日语元音序列的识别实验,提出的一种在噪声下学习的学习说话者的方法是使用SS(频谱减法)和CMN(倒谱均值归一化)进行学习。使用4130个扬声器获得的结果超过了传统方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号