首页> 外文期刊>電子情報通信学会技術研究報告. ヒュ-マン情報処理. Human Information Processing >ソナグラムの画像特徴に着目した音声·音楽·ノイズ区間識別手法の提案
【24h】

ソナグラムの画像特徴に着目した音声·音楽·ノイズ区間識別手法の提案

机译:语音,音乐和噪声间隔识别方法的提议,专注于Sonagram的图像特征

获取原文
获取原文并翻译 | 示例
       

摘要

本研究では,音信号のソナグラム(縦軸に周波数,横軸に時間をとり,ある時刻·周波数の音のパワーを色の濃淡で表した2次元画像)の画像特徴を利用した,音声·音楽·ノイズ区間識別手法を提案する.提案手法では,三種類の音区間それぞれで,ソナグラムの画像特徴が異なることに着目する.音声ではピーク周波数が緩やかに変化するため,ソナグラム上に緩やかなカープが描かれる.また音楽ではピーク周波数が一定値のまま一定時間持続するため,ソナグラム上に横方向の直線が多く現れる.さらにノイズではピーク周波数が安定しないため,ソナグラム上にランダムな点が多く現れる.そこで,ソナグラムの縦方向·横方向の画像周波数を求め,マハラノビス距離による判別分析を行う.この判別分析により、三種類の音(音声·音楽·ノイズ)から構成される音の区間識別を行う.実験により,提案手法による三種類の区間識別の精度,誤認識率を求めた.
机译:在本研究中,使用声音信号的音频和音乐(频率,横轴,频率的频率,以及一定时间/频率的声音),语音和音乐·我们提出噪音区间识别方法。在所提出的方法中,它专注于,SONAGRAM的图像特征因三种类型的声音部分中的每一种而异。由于峰值频率在语音中缓慢变化,因此在桑文时绘制了一个温和的鲤鱼。在音乐中,峰值频率持续一定的值,同时保持一段时间,使横向直线出现在Sonagram上。此外,由于峰值频率在噪音中不稳定,因此Sonagram上出现了大量随机点。因此,确定纵向方向上的图像频率和Sonagram的水平方向,并且执行Mahalanobis距离的辨别分析。这种判别分析使得部分识别由三种类型的声音(语音和音乐噪声)组成。实验通过所提出的方法和错误分子率确定了三种间隔的准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号