残響下音声認識における発話様式の実験的分析と評価

福森　隆寛; 中山　雅人; 森勢　将雅; 西浦　敬信; 山下　洋一

首页> 外文期刊>電子情報通信学会技術研究報告 >残響下音声認識における発話様式の実験的分析と評価

【24h】

残響下音声認識における発話様式の実験的分析と評価

机译：混响语音识别中语音模式的实验分析和评估

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年，音声認識技術の発展に伴って，ハンズフリー音声インターフェースが爆発的に普及している.残響環境下においてマイクロホンから離れて発話すると残響混入の影響により音声認識性能が著しく低下する問題がある.これに対して事前に音声認識システムの性能予測を行い，予測結果に基づいて音声認識システムの前処理に反映することで音声認識性能向上が期待できる.たとえば残響に頑健あるいは脆弱な話者を特定できれば，事前に各話者に適切な音響モデルを選択できる.そこで本研究では，残響下音声認識の性能向上を目指して音声認識性能の話者依存性について調査した.具体的には，多種の発話内容が収録されているCSRC連続音声データベースと残響環境のインパルス応答を用いて連続音素認識評価を行い，発話内容•発話様式と音声認識性能の関係を実験的に分析した.発話内容と音声認識性能の関係を評価した結果，明瞭に発声しやすい文章（天気予報文章など）は，残響の有無に関係なく音声認識性能が高いことを確認した.一方，発話様式と残響下音声認識性能の関係を評価した結果，両者間に顕著な傾向が確認できなかったことから，残響が発話様式に与える影響は小さいことがわかつた.%In recent years, a hands-free speech device has been developed with improving speech recognition techniques. The reverberant speech degrades the recognition performance in the field of distant-talking speech recognition. It is possibly addressed by taking preventive measures against the degradation of recognition performance by estimating the recognition performance. Identification of the speaker with robust or weak features against reverberation makes it possible to adapt acoustic model for each speaker toward improving the recognition performance. In this research, we investigated the speaker-dependence in the reverberant speech recognition toward improving recognition performance. We conducted the recognition experiments with CSRC continuous speech database in various conditions to evaluate the effect of reverberation on speaking-style. As a result of reverberant speech recognition experiment in each speaking-style, we could confirm the lower effects of reverberation on speaking-style since there was no clear tendency between reverberation and speech recognition performance.

机译：近年来，随着语音识别技术的发展，免提语音接口已经爆炸性地流行，并且存在以下问题：由于在混响环境中远离麦克风讲话时的混响的影响，语音识别性能显着降低。另一方面，通过预先预测语音识别系统的性能并基于该预测结果将其反映在语音识别系统的预处理中，可以期望语音识别性能提高，例如，可以确定健壮或易混响的扬声器。如果可能的话，可以预先为每个说话者选择合适的声学模型。因此，在本研究中，我们研究了说话者对语音识别性能的依赖性，目的是提高回响语音识别的性能。使用CSRC连续语音数据库进行连续音素识别评估，在该数据库中记录了话语内容和混响环境的冲激响应，并实验分析了话语内容和话语风格与语音识别性能之间的关系。通过评估演奏之间的关系的结果，证实了容易清楚地说出的句子（例如天气预报句子）具有高语音识别性能，而不管是否存在混响。评价的结果是，在两方之间没有确认到明显的趋势，并且发现混响对发声风格的影响很小。％近年来，已经开发了用于改善语音的免提语音设备。混响语音会降低远距离语音识别领域的识别性能，可能需要通过估计识别性能来采取预防措施来防止识别性能下降。混响使适应声学模型成为可能针对每个说话者，旨在提高其识别性能。在这项研究中，我们研究了混响语音识别中的说话者依赖性，以提高识别性能。我们使用CSRC连续语音数据库在各种条件下进行了识别实验，以评估混响对语音的影响作为每种口语风格的混响语音识别实验的结果，由于混响和语音识别性能之间没有明显的趋势，因此我们可以确认混响对口语风格的影响较小。

著录项

来源
《電子情報通信学会技術研究報告》 |2012年第47期|179-184|共6页
作者
福森　隆寛; 中山　雅人; 森勢　将雅; 西浦　敬信; 山下　洋一;
展开▼
作者单位

立命館大学　大学院情報理工学研究科　〒　525-8577　滋賀県草津市野路東　1-1-1;

立命館大学　情報理工学部　〒　525-8577　滋賀県草津巿野路東1-1-1;

立命館大学　情報理工学部　〒　525-8577　滋賀県草津巿野路東1-1-1;

立命館大学　情報理工学部　〒　525-8577　滋賀県草津巿野路東1-1-1;

立命館大学　情報理工学部　〒　525-8577　滋賀県草津巿野路東1-1-1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
残響下音声認識; 発話様式; 話者依存性; 性能予測; CSRC連続音声データベース;

机译：回响语音识别;说话风格;说话者依赖性;性能预测;CSRC连续语音数据库;
入库时间 2022-08-18 00:29:07

相似文献

外文文献
中文文献
专利

1. 残響下音声認識における発話様式の実験的分析と評価 [J] . 福森　隆寛, 中山　雅人, 森勢　将雅, 電子情報通信学会技術研究報告 . 2012,第49期

机译：混响语音识别中语音模式的实验分析和评估
2. 残響下音声認識における発話様式の実験的分析と評価 [J] . 福森　隆寛, 中山　雅人, 森勢　将雅, 電子情報通信学会技術研究報告 . 2012,第48期

机译：混响语音识别中语音模式的实验分析和评估
3. 残響下音声認識における発話様式の実験的分析と評価 [J] . 福森隆寛, 中山雅人, 森勢将雅, 電子情報通信学会技術研究報告. 信号処理. Signal Processing . 2012,第48期

机译：混响语音识别中语音模式的实验分析和评估
4. 残響下における誘導鈴の方向定位についての主観評価実験誘導鈴の移動支援設備としての性能評価に関する検討その１ [C] . 須見勇太, 岡田芳明, 橋本修日本建築学会大会;日本建築学会 . 2011

机译：混响下导铃定向的主观评估实验作为运动支撑设备的导铃性能评估的检验第1部分
5. 残響下における会話音声がワーキングメモリに及ぼす影響 : 図書館における静けさと賑やかさの共存を目指して [D] . 社本和磨, /シャモトカズマ 2019

机译：对话语音对混响下工作记忆的影响：旨在使图书馆保持安静与活泼并存
6. 歯の移動様式の違いにおける移動速度と歯根吸収の関係－ラット実験モデルにおける評価－ [O] . 田島(中野) 昂子 2014

机译：不同牙齿移动模式下运动速度与牙根吸收的关系 - 大鼠实验模型的评价 -

残響下音声認識における発話様式の実験的分析と評価

摘要

著录项

相似文献

相关主题

期刊订阅