首页> 外文期刊>Document Numerique >Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d'histoires
【24h】

Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d'histoires

机译:基于对故事的多模式搜索来实现电视连续剧的自动摘要

获取原文
获取原文并翻译 | 示例
       

摘要

Les séries télévisées récentes multiplient les personnages principaux, développant ainsi des intrigues complexes présentées à travers plusieurs histoires entremêlées. Nous proposons une approche de détection automatique de ces histoires afin de générer un résumé vidéo par extraction de scènes représentatives de ces dernières, et nous présentons un outil de visualisation rapide des histoires et du résumé obtenus. A partir d'une segmentation des épisodes en scènes (présentant une unité de temps, d'action et de contenu sémantique), les histoires s'obtiennent en regroupant les scènes, non nécessairement contigu?s, qui présentent une similarité sémantique forte. Les modalités utilisées sont visuelles, audio et textuelles. Nos expérimentations sont menées sur deux séries télévisées de formats différents.%Modern TV series have complex plots made of several intertwined stories following numerous characters. In this paper, we propose an approach for automatically detecting these stories in order to generate video summaries and we propose a visualization tool to have a quick and easy look at TV series. Based on automatic scene segmentation of each TV series episode (a scene is defined as temporally and spatially continuous and semantically coherent), scenes are clustered into stories, made of (non necessarily adjacent) semantically similar scenes. Visual, audio and text modalities are combined to achieve better scene segmentation and story detection performance. An extraction of salient scenes from stories is performed to create the summary. Experimentations are conducted on two TV series with different formats.rnmots-CLES : detection d'histoires, resume de series televisees, classification spectrale, regrou-pement hierarchique, multimodalite.
机译:最近的电视连续剧增加了主要角色,因此通过几个相互交织的故事展现了复杂的阴谋。我们提出了一种自动检测这些故事的方法,以便通过提取代表最后一个场景的场景来生成视频摘要,并提供一种快速可视化故事和所获得摘要的工具。通过将情节分割成场景(表示时间,动作和语义内容的单位),可以通过对场景进行分组来获得故事,这些场景不一定是连续的,具有很强的语义相似性。使用的方法是视觉,音频和文本。我们的实验是在两个不同格式的电视连续剧上进行的。在本文中,我们建议一种自动检测这些故事以生成视频摘要的方法,并建议使用一种可视化工具来快速轻松地观看电视连续剧。基于每个电视剧集的自动场景分割(一个场景被定义为在时间和空间上连续并且在语义上是连贯的),将场景聚类为故事,这些故事由(不一定相邻)语义相似的场景组成。结合了视觉,音频和文本模态,以实现更好的场景分割和故事检测性能。从故事中提取重要场景以创建摘要。在两个具有不同格式的电视连续剧中进行了实验。rnmots-CLES:故事检测,电视连续剧摘要,频谱分类,层次分组,多模式。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号