...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案
【24h】

括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案

机译:基于括号表达的Web文本挖掘,自动阅读自动阅读的提案

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

本論文では,ユーザの手動登録に依存しない流行語·新語などに対する自動読み付与の手法を提案する.音声認識の大きな課題として,未知語処理が挙げられる.特に,流行語·新語は正しい読みが得られず,未知語として扱われることが多い.近年,流行語などの読み訂正処理として,「はてな」のようなキーワードと読みがペアで登録されている集合知サイトを利用した読み付与による音声認識辞書の修正が提案されている.しかしながら,集合知サイトに基づく読み付与は,匿名ユーザの手動による登録に強く依存しているため,迅速な読みの登録やその読みの正しさが保証されないという問題がある.そこで,括弧表現に基づくWebテキストマイニングによる読みの自動抽出及び,その読みの信頼度計算を行なうことで,ユーザによる登録に非依存な自動読み付与の手法の提案を行なう.評価実験では,従来手法である「はてな」を用いた読み付与と提案手法との読み付与との性能比較を行い,提案手法は従来手法と同等またはそれ以上の性能を得ることができた.特に一般性が著しく改善された.
机译:在本文中,我们提出了一种自动阅读应用程序,用于剧情语言和不依赖于用户的手动注册的新词。被提到一种未知的语言治疗作为语音识别的主要挑战。特别是,超越历程和新语言无法获得正确的阅读,并且经常将其视为一个未知的单词。近年来,作为时尚诸如时尚的读取校正处理,通过读取诸如“Hatano”的一组知识和使用在一对中注册的一组知识站点的一组知识进行读取来修改语音识别字典。但是,基于一组知识网站的阅读强烈依赖于匿名用户的手动注册,因此存在问题,即不保证它不保证快速阅读注册及其阅读权。因此,通过基于括号的Web文本挖掘执行自动提取读取和读取的可靠性计算,我们提出了一种独立于用户注册的自动阅读应用程序的方法。在评估实验中,我们使用“Hatano”是一种传统方法的所提出的方法的读取和阅读的性能,并且所提出的方法可以获得与传统方法相同或更高的性能。特别是,展会显着改善。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号