文字単位のモデルを併用した単語単位のEnd-to-End 音声認識

机译：使用字符单元模型在一起的单词单元的端到端语音识别

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

従来のDNN-HMM ハイブリッド音声認識より簡単な構造で実現できるEnd-to-End 音声認識に関して研究が近年なされている。End-to-End 音声認識はHMM のような潜在状態の遷移をモデル化する必要はなく，直接音響特徴量から目的の記号(音素や文字など) を推定でき，高速なデコーディングが実現できる。従来のEnd-to-End 音声認識は出力単位を音素や音節、文字などのサブワードとしており，依然として単語系列を出力する際には発音辞書や言語モデルを必要とする。これに対して，音響特徴量から単語を直接出力とするモデルも研究されている[3]。RNN を用いることで言語モデルも含めることができるので，単語単位のモデルは言語モデルが必要なく，非常に簡潔で高速な認識が実現できる。しかし単語単位モデルでは訓練データのスパース性と，未知語が認識不可能なことが問題として挙げられる。そこで本研究では文字を出力系列とするモデルを併用した単語単位End-to-End 音声認識を提案する。文字を出力単位とするモデルを併用することで訓練データの得られない問題を緩和することができる。また文字単位モデルは単語単位モデルが未知語を出力した際のデコードにも使用する。

机译：传统的DNN-HMM混合语音识别可以与一个单一结构来实现的端至端的语音识别研究在近几年已经完成。 END - 端语音识别需要潜过渡，例如HMM模型没有，直接声学特征量的目的符号（phonem或字符可估计，并且可以实现高速解码ns。常规终端到END的语音识别是输出单元和这是一个子词，例如音节，字，而且还当输出一个字序列，语音字典和语言模型我需要。在另一方面，从声学特征字一个模型被直接输出也进行了研究[3]。 RNN因为它是可以通过使用包括语言模型，字单元模型没有语言模型，是很容易良好的识别速度可以实现。然而，在字单元模型，训练数据的稀疏作为一个问题，即性和未知的语言不能被识别有可能的。因此，在这项研究中，性格输出序列使用Dell建议的单词单元端至端的语音识别做。与字符输出单元相结合的模型能缓解不能得到训练数据问题穿。在字符单元模型，字单元型号未知还用于当字是输出进行解码。

著录项

来源
《日本音響学会研究発表会》|2018年|xliv 149 p.|共2页
会议地点
作者
上乃聖; 稲熊寛文; 三村正人; 河原達也;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类声学工程 ;
关键词

相似文献

外文文献
中文文献
专利

1. 音素弁別特徴を用いた頑健な対話音声認識－モーラ単位サブワードモデルの検討 [J] . 伊勢路真吾, 福田隆, 山田博文, 電子情報通信学会技術研究報告. 音声. Speech . 2003 ,第93期

机译：使用声音区分功能的可靠对话语音识别-Mora单位子词模型的检验
2. 音素弁別特徴を用いた頑健な対話音声認識－モーラ単位サブワードモデルの検討 [J] . 伊勢路真吾, 福田隆, 山田博文, 電子情報通信学会技術研究報告. 音声. Speech . 2003 ,第93期

机译：强大的对话语音识别使用Phylon鉴别特征 - 莫拉单位副模型检查
3. 形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル [J] . 五十川賢造, 篠田浩一, 嵯峨山茂樹, 電子情報通信学会技術研究報告. 音声. Speech . 2002 ,第529期

机译：基于形态学信息和词内位置信息的语音识别语音模型
4. 文字単位のモデルを併用した単語単位のEnd-to-End 音声認識 [C] . 上乃聖, 稲熊寛文, 三村正人, 日本音響学会2018年春季研究発表会講演論文集 . 2018

机译：使用逐个字符模型逐个单词地进行端到端语音识别
5. 単位電力変換器を多直列接続したカスケード?マルチレベル変換器の性能向上に関する研究 [D] . 児山裕史, /コヤマユウシ 2019

机译：串联多单元功率变换器的级联-多电平变换器性能改进研究
6. 聴覚モデルを用いたサブワード単位単語音声（日本語）認識システム [O] . 谷口秀次 2005

机译：使用听觉模型的子单词单词语音（日语）识别系统

文字単位のモデルを併用した単語単位のEnd-to-End 音声認識

摘要

著录项

相似文献

相关主题

期刊订阅