首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >初等中等教育における授業音声認識のための言語モデルの検討
【24h】

初等中等教育における授業音声認識のための言語モデルの検討

机译:小学中学教育中型语音识别语言模型研究

获取原文
获取原文并翻译 | 示例
           

摘要

初等中等教育における授業音声の音声認識の研究を行う.これまでの講義の音声認識は主に大学などの高等教育における学習支援を対象として行われており,初等中等教育を対象としたものはほとhど行われていなかった.初等中等教育でも初期段階,すなわち小学校授業の学習·教育支援は社会的意義が大きく重要である.小学校授業での発話は,児童向けの発話であるため,言いまわしおよび使用される語彙において大学の講義などの成人向けの発話と大きく異なる.このため本研究では,小学校授業の音声認識用の言語モデルの検討を行うた.13件の授業音声の分析を行ったところ,よびかけに関する発話が27.7%と多く存在することを確認した.大人向けのテキストコーパス(日本語話し言葉コーパスおよび新聞記事1年分)で単語3-gram言語モデルを学習しても,カバーできない単語3-gramがテストデータのおよそ半数,3000種類存在することがわかり,補正パープレキシティも340程度と大きいことがわかった.小学生向けのWEBサイトから(約1.2M単語)を用いて言語モデルを学習したところ,大人向けテキストでカバーできなかった3-gramの3000種類のうち,1000種類をカバーできることがわかった.さらに,CSJと併用して言語モデルを学習することで,大人向け新聞記事1年分で学習した言語モデルとほぼ同程度のテストセットパープレキシティを得ることができた.子ども向けWEBサイトから小学校授業の言語モデルを学習する重要性を確認した.
机译:初中教育课堂讲话的演讲识别研究。迄今为止的讲座的演讲识别主要是为了在高等教育中的学习支持,如大学,并且尚未完成初级或中学教育的人。即使在小学课程的初级阶段,即初步阶段,即学习和教育支持对于社会重要意义而言是非常重要的。由于小学课程中的话语是儿童的言论,因此与演讲词汇和使用的词汇和大学讲座使用。因此,在本研究中,我们检查了小学课程的语音识别语言模型。在分析13级课堂后,证实泄漏有很多言论,27.7%。即使您在成人的文本语料库(日语或一年)中学到一个单词3克语言模型,即使您学习一个单词3克语言模型,也不能涵盖大约有一半的测试数据和存在3000种。发现校正的PURP词典也大于约340。从基本学校的网站使用(约1.2米单词)学习语言模型,结果证明1000种3000种类型的300克,可以覆盖成人文本,可以覆盖1000种类型。此外,通过与CSJ组合学习语言模型,可以获得几乎与成人报纸文章一年内学到的语言模型相同的测试集。我们已确认从儿童网站学习小学课程的语言模型的重要性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号