...
首页> 外文期刊>電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics >Web上に投稿された動画と字幕データによる音声データベース構築
【24h】

Web上に投稿された動画と字幕データによる音声データベース構築

机译:通过视频和字幕数据发布在网络上的语音数据库构建

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

動画投稿サイトに投稿された動画の音声情報とその動画に付随するユーザー作成の字幕データを利用し,発話音声データとそれに対応付けられた書き起こしデータをWeb上から入手し,データベースを作成する.作成したデータベースは機械学習などの音声研究に役立つことが期待できる.音声と字幕を取得するのは容易だが,音声データに発話以外の要素(BGMや効果音など)が含まれるケースも多いため,そのまま利用するとデータべースとしては不完全なものになってしまう.本研究ではその対策方法について検討した.
机译:使用发布在视频发布站点上的视频的视频音频信息和与视频相关联的用户创建的字幕数据,我们从Web获取话语语音数据和相关的写入数据,并创建数据库。 创建的数据库可以预期对机器学习等语音研究有用。 易于获取语音和字幕,但是有很多情况下语音数据包括语音以外的元素(BGM或声音),因此如果您使用它,它将变得不完整为数据库。 在这项研究中,我们检查了措施方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号