首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索
【24h】

距離マトリクス画像中からの直線検出によるワードスポッティング(LD-DMI法)を用いた電話会話ログ検索

机译:通过从距离矩阵图像中检测直线,使用单词斑点(LD-DMI方法)进行电话对话日志搜索

获取原文
获取原文并翻译 | 示例
           

摘要

電話会話の検索サービスに対するニーズは通信販売やヘルプデスク等を中心に顕在化しているが,電話を多用するオフィス業務においてもキーワード入力による電話会話の検索が可能となれば,生産性向上に貢献できるものと期待される.一方,音声コンテンツを検索する技術は,講演音声やニュース音声などある程度の規則性を想定できる言語モデルを前提とした研究が進んでいるが,一般の電話会話では言語モデルの構築が難しいことから十分な研究が進んでいない.また,検索用エントリーデータはキーボードやタッチパネルから入力されることを前提としており,検索用キーを音声で入力する方式は検討されていない.そこで,本報告では音響モデルのパターンマッチングによるワードスポッティングを対象とし,従来法として連続DP を,提案法として距離マトリクス画像中からの直線検出によるワードスポッティングを新手法として両者の性能を比較する.特に,新手法において距離マトリクス画像の二値化しきい値を,画像の特性に応じて適応的に調整する性能改善案を検討した.適合率90%における再現率と,再現率90%における適合率を用いて評価した結果,提案手法は従来法に比較して概ね5%程度改善できることを明らかにした.
机译:对电话对话搜索服务的需求主要在邮购销售和服务台中变得明显,但是如果即使在大量使用电话的办公室工作中也可以通过输入关键字来搜索电话对话,则将有助于提高生产率。预期会。另一方面,在可以假设一定程度的规则性的语言模型(例如演讲语音和新闻语音)的前提下研究用于搜索语音内容的技术,但是这是足够的,因为在一般的电话交谈中难以建立语言模型。研究没有进展。另外,假定从键盘或触摸面板输入搜索条目数据,并且尚未研究通过语音输入搜索键的方法。因此,在本报告中,我们将重点放在通过声学模型的模式匹配进行单词识别上,并比较通过使用连续DP作为常规方法和通过从距离矩阵图像中检测直线来进行单词识别这两种方法的性能。特别是,在新方法中,我们研究了一种性能改进计划,该计划根据图像的特征自适应地调整距离矩阵图像的二值化阈值。作为使用精度为90%的查全率和精度为90%的查全率进行评估的结果,明确了与传统方法相比,所提出的方法可以提高大约5%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号