...
首页> 外文期刊>電子情報通信学会技術研究報告 >連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索
【24h】

連続単語音声認識結果の読み系列を利用した辞書未登録語の音声文書検索

机译:使用连续单词语音识别结果的阅读顺序检索未注册单词的语音文档

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

マルチメディアコンテンツ利用機会の増加に伴い,ユーザが見たい場面を容易に検索できる機能が求められる.この機能の実現手法として,音声区間を音声認識し検索キーワードの含まれる区間を特定する方式が研究されているが,音声認識に用いる単語辞書に未登録の言葉は検索が困難であるという問題がある.本稿では,音声認識結果に付加される単語の読み系列を利用することで,辞書未登録語であっても検索可能とする新たなアプローチを提案する.提案方式では,クエリとして辞書未登録語が入力されると,音声認識結果からクエリと類似する読み系列が含まれる区間を類似度に従って高い順位のものから候補文書として出力する.この際,サブワード間音響距離を照合時局所距離として用いることで検索精度の向上を図り,さらに候補文書に対する再認識処理を行うことで一層の検索精度の向上を図った.評価実験では,サブワード間音響距離,再認識処理を用いることで検索性能の向上を確認した.サブワード列照合方式と比べ同等の検索精度が得られ,本手法の有効性を示した.%According to the wide spread of multimedia environment and HDD recorders, many users come to watch and operate video data and information retrieval from video data has been needed these days. For this purpose, many researches have been conducted using a result of a speech recognizer. It is difficult for such a method to deal with out-of-vocabulary (00V) words for a speech recognizer. Therefore, the paper propose a new approach to enable to retrieve an OOV word section by using phone sequences obtained form the result of a speech recognizer. The proposed approach introduces a phonetic distance matrix and a re-recognition process. The phonetic distance matrix expresses a phonetic distance between any two subwords. These methods are expected to recover substitution errors and improve the retrieval performance. Our experimental results demonstrated the proposed method achieved the comparable performance to the subword matching method without additional processes and large indexes.
机译:随着多媒体内容的使用的增加,要求用户具有允许他们容易地搜索期望场景的功能。作为实现该功能的方法,已经研究了识别语音部分并指定包含搜索关键字的部分的方法,但是存在难以搜索未注册在用于语音识别的单词词典中的单词的问题。在那儿。在本文中,我们提出了一种新方法,通过使用添加到语音识别结果中的单词阅读序列,甚至可以搜索未注册的单词。在所提出的方法中,当输入字典中未登记词作为查询时,根据相似度,包含具有与该查询相似的阅读序列的部分作为从最高排名的候选文档输出。此时,我们使用子词之间的声学​​距离作为匹配期间的局部距离,以提高搜索精度,并进一步对候选文档进行重新识别处理,以进一步提高搜索精度。在评估实验中,我们确认利用子词之间的声距和重新识别过程可以提高搜索性能。与子词字符串匹配方法相比,获得了相似的检索精度,证明了该方法的有效性。 %由于多媒体环境和HDD记录器的广泛普及,近来有许多用户观看和操作视频数据,因此需要从视频数据中检索信息。为此,使用语音识别器的结果进行了许多研究。对于语音识别器来说,这种方法很难处理非语音(00V)单词。在此,本文提出了一种新方法,该方法可以通过使用从语音识别结果中获得的电话序列来检索OOV单词部分。该方法引入了语音距离矩阵和重新识别过程,该语音距离矩阵表示任意两个子词之间的语音距离,这些方法有望恢复替换错误并提高检索性能,实验结果表明所提出的方法可以实现与子词匹配方法相当的性能,而无需额外的过程和较大的索引。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2008年第142期|p.61-66|共6页
  • 作者单位

    岩手県立大学ソフトウェア情報学部 〒020-0193岩手県岩手郡滝沢村滝沢字巣子152-52;

    岩手県立大学ソフトウェア情報学部 〒020-0193岩手県岩手郡滝沢村滝沢字巣子152-52;

    岩手県立大学ソフトウェア情報学部 〒020-0193岩手県岩手郡滝沢村滝沢字巣子152-52;

    岩手県立大学ソフトウェア情報学部 〒020-0193岩手県岩手郡滝沢村滝沢字巣子152-52;

    筑波大学大学院 図書館情報メディア研究科 〒305-8550茨城県つくば市春日1-2;

    産業技術総合研究所 情報技術研究部門 〒305-8568茨城県つくば市梅園1-1-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    音声認識; 音声文書検索; 辞書未登録語; サブワード;

    机译:语音识别;语音文档搜索;字典未注册词;子词;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号