N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識

北岡教英; 高橋伸寿; 中川聖一; Norihide Kitaoka; Nobutoshi Takahashi; Seiichi Nakagawa

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識

【24h】

N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識

机译：n最佳线性词典搜索和1 - 最近似树结构字典Search Condurate词汇连续语音识别

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

HMMに基づく大語彙連続音声認識システムでは,語彙数の増加に伴い認識時間が増加する。そこでサブワード単位でプレフィクスを単語間で共有した木構造化辞書を用いることで状態数を削減する。また認識過程において音声の各時刻における部分文仮説に接続しうる単語を次々とつないでいくと仮説数が急速に増大するため,単語境界や尤度の単語履歴依存性に対して近似手法を用いる。まず,木構造辞書とバイグラムを用いた認識手法における単語履歴依存性の近似手法,および線形辞書を用いた認識手法について比較検討を行った。 1-best近似木構造辞書探索は効率が良いが探索仮定で最適な解が失われる可能性が高いこと,線形辞書に関しては最適な解は求められるが効率が悪い。これらを踏まえ,木構造辞書を用いた1-best近似探索と,一部の単語を動的に線形に展開して探索する方法とを併用する手法を提案する。この手法を読み上げ音声およびニュース音声において実験的に評価した。その結果,全2万単語のうち250単語について線形辞書に動的に展開することによって,読み上げ音声では正解精度約5％および正解率約3％,ニュース音声では正解精度約2％,正解率約3％の性能の向上を得ることができた。

机译：在基于HMM的大型词汇连续语音识别系统中，随着词汇量增加的识别时间增加。因此，通过使用树结构化词典共享子境部单元中的前缀来减少状态的数量。另外，由于当假设的数量快速增加，如果通过连接可以在识别过程中的每次语音中连接到部分句子假设的单词，可以快速增加假设的数量，则假设的数量快速增加。字边界或可能性的假设和似然词历史依赖的数量。首先，我们使用树形结构字典和Bygra将单词历史依赖性近似方法和识别方法使用线性字典进行比较。 1 - 最佳近似木结构词典搜索是高效，但最佳解决方案可能会在搜索假设中丢失，并且线性词典需要最佳解决方案，但效率差。基于这些，我们提出了一种使用树结构词典使用1-最近似搜索的方法和动态扩展和搜索单个单词的方法。这种方法在语音和新闻演讲中实验评估。结果，通过动态部署所有20,000个单词的250个单词的线性词典，正确的答案精度约为5％，正确的答案率约为3％，正确的答案精度约为2％，并且正确率是正确的大约2％。我能够提高3％的表现。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2003年第94期|共6页
作者
北岡教英; 高橋伸寿; 中川聖一; Norihide Kitaoka; Nobutoshi Takahashi; Seiichi Nakagawa;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
大語彙連続音声認識; 探索; 木構造辞書; 1-best近似; 線形辞書; Large vocabulary continuous speech recognition; Search; Tree lexicon; 1-best approximation; Linear lexicon;

机译：大词汇连续语音识别;搜索;树结构字典;1 - 最佳近似;线性词典;大词汇连续语音识别;搜索;树词典;1 - 最佳近似;线性词汇;

相似文献

外文文献
中文文献

1. N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識 [J] . 北岡教英, 高橋伸寿, 中川聖一, 電子情報通信学会技術研究報告. 音声. Speech . 2003,第94期

机译：结合使用N最佳线性字典搜索和1最佳近似树形结构字典搜索进行大词汇量连续语音识别
2. 連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索 [J] . 栗城吾央, 伊藤慶明, 小嶋和徳, 電子情報通信学会技術研究報告. 音声. Speech . 2008,第142期

机译：使用连续单词语音识别结果的阅读系列来搜索字典中未注册单词的语音文档
3. 連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索 [J] . 栗城　吾央, 伊藤慶明, 小嶋和徳, 電子情報通信学会技術研究報告 . 2008,第142期

机译：使用连续单词语音识别结果的阅读顺序检索未注册单词的语音文档
4. 大量学術論文から抽出した複合語を階層分類することで材料辞書として構築し、RDFによりデータベース化した。本辞書の活用によりMI用学習データの自動生成が可能になると考える。 [C] . 岡博之, 佐藤義貴, 近藤修平, . -1

机译：通过从大量学术论文提取的复合词的分层分类，它被RDF构造为物质词典和数据库。考虑通过利用此持续时间来执行自动生成MI学习数据。
5. 辞書の変形を用いた手書き文字認識アルゴリズムの研究利用統計を見る [D] . 泉井良夫 1986

机译：基于字典变换的手写字符识别算法研究参见用法统计
6. 清末期の日本人学者による北京官話の声調認識 : 四種類の，日本人学者編集の中国語の辞書と教科書を手がかりに [O] . 李无未, Wuwei Li 2004

机译：认识到清末日本学者的北京官方故事的基调

N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識

摘要

著录项

相似文献

相关主题

期刊订阅