首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討
【24h】

音素弁別特徴間距離に基づくキーワード検出における音節単位サブワードモデルの検討

机译:基于语音识别特征之间距离的关键词检测中音节单位子词模型的检验

获取原文
获取原文并翻译 | 示例
           

摘要

言語モデルをサブワードモデルに置換えた汎用LVCSRエンジンを利用し,対話音声中のキーワードを高い精度で抽出する方法を研究している.これまで,汎用エンジンが持つ固有言語モデルの制約を緩めると共に,認識結果の音素列に音素弁別特徴(DPF) ベクトルに基づくキーワードスポッティングを適用する方式を提案し,道案内タスク対話音声中のキーワード検出実験から,この方式が置換·脱落·付加誤りの少ないことを報告した.本報告では,日本語の全ての音節構造を考慮したサブワードモデルを利用することにより,少ない語彙数(20k辞書の1/40)で高い精度を維持することができることを示す.これによりメモリと計算負荷を大幅に低減できる.汎用エンジンの20k辞書 (0-gram) との比較実験では,最初に (a) 汎用エンジン中の音節長の短い単語のみを辞書に登録(辞書サイズ1/2)することで同等の性能が得られることを示す.次に, (b) 辞書中の単語から短音節単位サブワードモデルを作成することを検討し,2短音節の3-gramで同程度の性能が得られることを示す.最後に, (C) 新聞記事から得られる日本語の全ての音節構造を検討し,短音節,長母音音節,撥音付き音節,促音付き音節,二重母音音節をサブワードとして採用することで,20k辞書と比較し1/40の登録項目で同等の性能が得られることを示す.
机译:我们正在研究一种使用通用LVCSR引擎以高精度提取对话语音中的关键字的方法,该引擎将语言模型替换为子词模型。到目前为止,我们已经放宽了通用引擎适当语言模型的限制,并提出了一种方法,该方法将基于语音识别特征(DPF)向量的关键词识别应用于识别结果的语音序列,以及在路线引导任务对话语音中进行关键词检测。从实验中报道,该方法具有较少的取代,遗漏和加成误差。在此报告中,我们表明,通过使用考虑日语中所有音节结构的子词模型,可以用少量词汇(20k词典的1/40)来保持较高的准确性。这样可以大大减少内存和计算负荷。在使用通用引擎20k词典(0克)的比较实验中,通过首先(a)在通用引擎中仅将短音节长度的单词注册到词典中(字典大小为1/2),可以获得相同的性能。它表明可以做到。接下来,(b)考虑从字典中的单词为每个短音节创建一个子词模型,并表明使用3克的两个短音节可以获得相同的性能。最后,通过检查从报纸文章获得的日语的所有音节结构,并采用短音节,长元音节音,驱避音节,提示音节和双元音节音作为子词,来制作20k词典。结果表明,使用1/40的注册项目可以获得相同的性能。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号