首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >発話者情報によるテレビシーン検索のための字幕情報を用いた話者識別
【24h】

発話者情報によるテレビシーン検索のための字幕情報を用いた話者識別

机译:基于字幕信息,使用字幕信息进行电视场景搜索的演讲者识别

获取原文
获取原文并翻译 | 示例
           

摘要

録画機器の発達に伴い,大量の映像コンテンツがアーカイブ化されている.そのため,視聴者の要求する映像をすばやく提供するために,メタデータによる検索システムが数多く提案されている.本研究では従来手法によってメタデータの自動抽出が行われていないドラマ,アニメーション,バラエティ番組を対象とする.これらの番組の全ての台詞に対して発話者情報をメタデータとして抽出する.具体的には,デジタル放送に付与されている字幕情報を活用することで識別モデルの高精度化を行う.また,同時に発話傾向を考慮した話者の出現頻度を用いて識別結果を重み付けすることによって効果的なディジタル放送の話者識別を実現する.20番組を用いて評価を行った結果,従来手法より5.7%改善された.
机译:随着记录设备的发展,大量的视频内容已经被存档。因此,已经提出了许多基于元数据的搜索系统,以便快速提供观看者所请求的视频。在这项研究中,我们以戏剧,动画和综艺节目为目标,这些戏曲,动画和综艺节目不能通过常规方法自动提取元数据。发言人信息被提取为这些程序所有对话的元数据。具体地,通过利用赋予数字广播的字幕信息来提高识别模型的准确性。同时,通过考虑说话趋势,利用说话者的出现频率对识别结果进行加权,可以实现有效的数字广播说话者识别。使用20个程序进行评估的结果,与传统方法相比,改进了5.7%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号