首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声入力によるWeb検索のためのキーワード認識·抽出法の改善
【24h】

音声入力によるWeb検索のためのキーワード認識·抽出法の改善

机译:语音输入网页搜索关键词识别/提取方法的改进

获取原文
获取原文并翻译 | 示例
           

摘要

近年,ウェブ検索の分野では,NTCIRワークショップ等で競争型のコンテストが行なわれるなど,研究が盛んにおこなわれている.我々は,以前,Web検索の分野の中でも音声入力によWebる検索の有用性に着目し,NTCIR-3音声入力Web検索タスクにおいて,クエリーの音声認識率を改善することで検索精度を改善する方法を提案した.本稿では,さらにクエリーの音声認識率の改善を図るために,音声認識で用いる認識辞書の語彙サイズを2万語から6万語へ拡大することを試み,その検索実験について報告する.実験結果より,Web文書の検索性能を増加させるには,音声クエリーを認識する際の辞書の語彙サイズを増加させ,未知語を減少させることで認識率を改善することが大変有効であることが分かった.また,以前提案したSVMによる複数の認識モデルの出力の混合も語彙サイズに関わらず有効であることを示せた.
机译:近年来,在网络搜索领域,已经积极地进行了研究,例如在NTCIR研讨会上举行竞争性竞赛。以前,我们一直致力于通过语音输入在Web搜索领域中进行Web搜索的实用性,并通过提高NTCIR-3语音输入Web搜索任务中查询的语音识别率来提高搜索准确性。我提出了一种方法。在本文中,为了进一步提高查询的语音识别率,我们尝试将用于语音识别的识别词典的词汇量从20,000个单词扩展到60,000个单词,并报告搜索实验。从实验结果来看,为了提高Web文档的搜索性能,在识别语音查询和减少未知单词时,通过增加词典的词汇量来提高识别率非常有效。你明白了吗还显示出,无论词汇量多大,先前提出的支持向量机支持的多种识别模型输出的混合也是有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号