音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

酒井啓行; ツィンツァレクトビアス; 川波弘道; 猿渡洋; 鹿野清宏; 李晃伸; SAKAI Hiroyuki; CINCAREK Tobias; KAWANAMI Hiromichi; SARUWATARI Hiroshi; SHIKANO Kiyohiro; LEE Akinobu

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

【24h】

音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

机译：基于声学模型和语言模型的语音间隔检测免提语音识别算法的评估

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響モデルと言語モデルに基づく認識による音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価を行う.従来のVAD手法として振幅パワー,統計モデル,GMMなどに基づく手法を挙げ,性能比較実験を行うことで提案手法の有効性を示す.

机译：需要引入免提界面以实现人与语音对话机器人之间的自然对话，在免提语音识别系统中，各种背景噪音会混入其中，并且用户直接声音的能量会减弱。输入语音的信噪比（SNR）由于各种原因而降低，例如，随着SNR的降低，很难检测到识别用户语音片段的语音片段，并且在嘈杂的环境中有效。尚未建立语音片段检测方法，本文评估了一种免提语音识别算法，该算法使用基于声学模型和语言模型通过识别进行语音片段检测的算法，该模型即使在嘈杂的环境中也能可靠地检测用户的语音片段。通过引用基于幅度功率，统计模型，GMM等的方法（作为常规VAD方法）进行性能比较实验，我们将展示该方法的有效性。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2007年第406期|共6页
作者
酒井啓行; ツィンツァレクトビアス; 川波弘道; 猿渡洋; 鹿野清宏; 李晃伸; SAKAI Hiroyuki; CINCAREK Tobias; KAWANAMI Hiromichi; SARUWATARI Hiroshi; SHIKANO Kiyohiro; LEE Akinobu;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
音響モデルと言語モデルに基づく認識による音声区間検出; ハンズフリー音声認識; 実環境対話ロボット; Voice Activity Detection (VAD) by decoding based on Acoustic Model and Language Model; Hands-Free speech recognition; Real-environment spoken dialogue robot;

机译：通过基于声学模型和语言模型的解码进行语音活动检测（VAD）;免提语音识别;真实环境的口语对话机器人;

相似文献

外文文献
中文文献
专利

1. 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価 [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 音声. Speech . 2007,第406期

机译：基于声学模型和语言模型的语音间隔检测免提语音识别算法的评估
2. 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価 [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 音声. Speech . 2007,第406期

机译：基于声学模型和语言模型的音频截面检测评估免提语音识别算法
3. 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価 [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2007,第405期

机译：基于声学模型和语言模型的音频截面检测评估免提语音识别算法
4. フィルタリングアルゴリズムを逆解析手法とする5層フレームモデルの水平剛性の同定:その１拡張カルマンフィルタと拡張VPPFに基づくアルゴリズム [C] . 遠藤龍司, 池田義人, 登坂宣好日本建築学会大会;日本建築学会 . 2013

机译：使用滤波算法作为逆分析方法识别5层框架模型的水平刚度：第1部分基于扩展卡尔曼滤波器和扩展VPPF的算法
5. 肝機能障害の評価法とその障害機序に関する研究; ヒト肝ミトコンドリアの日内代謝変動に基づく肝機能評価及び動物モデルを用いた肝ミトコンドリア障害機序 [D] . Iwata, Shingo 1993

机译：肝功能障碍评估方法及其机制的研究；基于人肝线粒体每日代谢变化和肝线粒体损伤机制的动物模型对肝功能的评估
6. 聴覚大脳系のモデルに基づく音場の心理的反応に関する研究: 相互相関メカニズムおよび自己相関メカニズムから抽出されたファクターに基づく評価 [O] . Sato Shin-ichi 1999

机译：基于听觉大脑系统模型的声场心理反应研究：基于互相关机制和自相关机制提取的因素的评估

音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

摘要

著录项

相似文献

相关主题

期刊订阅