複数の言語情報を用いたCRFによる音声認識誤りの検出

松本　智彦; 佐古　淳; 滝口　哲也; 有木　康雄

首页> 外文期刊>電子情報通信学会技術研究報告 >複数の言語情報を用いたCRFによる音声認識誤りの検出

【24h】

複数の言語情報を用いたCRFによる音声認識誤りの検出

机译：CRF使用多种语言信息进行语音识别错误检测

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Recently, a learning method of n-gram showing error tendency is focused on. In this method, it is difficult to learn low frequency n-gram appropriately. On the other hand, error detection method for content words was proposed that uses semantic similarity in neighboring recognition result. In this paper, we especially examine semantic score and propose a method for speech recognition error detection that integrates these information. As a result of evaluation experiment using the Corpus of Spontaneous Japanese, error detecting performance was improved for content words in particular. Moreover, semantic score is effectively used by combining with term-weight.%近年，音声認識誤りの検出訂正には，誤り傾向を示すn-gramを学習する「誤り傾向学習」という手法が注目されている．この手法には，出現頻度の低いn-gramに対しては適切に学習を行うことができないという問題があると考えられる．また，周辺の単語との意味的類似度をスコア化し，内容語の認識誤りを検出する手法が提案されている．本稿では，特に後者の意味スコアについて検討し，これらの情報を統合した音声認識誤りの検出法を提案する．日本語話し言葉コーパスによる評価実験の結果，「誤り傾向学習」で用いる素性に意味スコアを追加することで，特に内容諸において誤り検出性能の改善が得られた．また，単語重みと組み合わせることで意味スコアを有効に活用することができた．

机译：近年来，人们集中研究了一种表示错误趋势的n-gram的学习方法，这种方法很难适当地学习低频n-gram。另一方面，提出了一种利用语义相似度的内容词错误检测方法。在本文中，我们特别研究了语义分数，并提出了一种将这些信息整合在一起的语音识别错误检测方法。作为使用自发日语语料库的评估实验的结果，特别是对于内容单词的错误检测性能得到了改善。而且，近年来，作为检测和校正语音识别错误的方法，学习表示错误趋势的n-gram的称为“错误趋势学习”的方法引起了关注。该方法可能存在无法正确学习出现频率低的n-gram的问题。另外，已经提出了一种方法，其中对与周围单词的语义相似性进行评分并且检测内容单词的识别错误。在本文中，我们特别考虑了后者的语义分数，并提出了一种整合这些信息的语音识别错误检测方法。作为使用日语语料库的评估实验的结果，通过将语义评分添加到“错误倾向学习”中使用的功能中，特别是在各种内容中，错误检测性能得到了改善。此外，通过结合单词权重可以有效地使用语义分数。

著录项

来源
《電子情報通信学会技術研究報告》 |2009年第422期|p.7-12|共6页
作者
松本　智彦; 佐古　淳; 滝口　哲也; 有木　康雄;
展开▼
作者单位

神戸大学大学院工学研究科　〒657-8501兵庫県神戸市灘区六甲台町1-1;

神戸大学大学院工学研究科　〒657-8501兵庫県神戸市灘区六甲台町1-1;

神戸大学自然科学系先端融合研究環　〒657-8501兵庫県神戸市灘区六甲台町1-1;

神戸大学自然科学系先端融合研究環　〒657-8501兵庫県神戸市灘区六甲台町1-1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
音声認識誤り検出; 信頼度; 言語情報; 意味情報; CRF;

机译：语音识别错误检测;可靠性;语言信息;语义信息;CRF;
入库时间 2022-08-18 00:35:13

相似文献

外文文献
中文文献
专利

1. 複数の言語情報を用いたCRFによる音声認識誤りの検出 [J] . 松本智彦, 佐古淳, 滝口哲也, 電子情報通信学会技術研究報告. 音声. Speech . 2008,第422期

机译：使用多种语言信息通过CRF检测语音识别错误
2. 複数の言語情報を用いたCRFによる音声認識誤りの検出 [J] . 松本智彦, 佐古淳, 滝口哲也, 電子情報通信学会技術研究報告. 音声. Speech . 2008,第422期

机译：使用多语言信息检测CRF的语音识别错误
3. 未知語とその周辺単語の音声認識誤りを考慮したCRFによる音声認識誤り訂正 [J] . 中谷良平, 岩橋直人, 中野幹生, 電子情報通信学会技術研究報告. 音声. Speech . 2011,第365期

机译：考虑未知词和周围词的语音识别错误的CRF语音识别错误校正
4. 遠野物語における複数言語の音声認識モデルを用いたキーワード検出精度向上 [C] . 飯田英仁, 小嶋和徳, 李時旭, 情報処理学会;情報処理学会全国大会 . 2020

机译：在Tono Monogatari中使用多语言语音识别模型提高关键字检测的准确性
5. 副作用自発報告データベース及び医療情報データベースを用いた、デノスマブによる低カルシウム血症に関する、発症例の検出及び行政施策の影響評価 [D] . 竹山麻由 2019

机译：使用不良反应自发报告数据库和医学信息数据库来检测由地诺单抗引起的低血钙病例并评估行政措施的影响
6. 韓国語を母語とする日本語学習者における日本語の「パラ言語情報」に関する実験音声学的研究 : 「問い返し」と「疑い」の実現および知覚の側面から [O] . 李宝瓊, イボギョン 2017

机译：在母语为朝鲜语的日语学习者中对日语的“副语言信息”进行语音实验的实验研究：从实现和感知“疑问”和“怀疑”方面

複数の言語情報を用いたCRFによる音声認識誤りの検出

摘要

著录项

相似文献

相关主题

期刊订阅