首页> 外文学位 >Using sparse CCA for vocabulary selection.
【24h】

Using sparse CCA for vocabulary selection.

机译:使用稀疏CCA进行词汇选择。

获取原文
获取原文并翻译 | 示例

摘要

A content-based autotagging system is a computer system that automatically annotates multimedia data such as music, images, and video with tags (semantically-meaningful text-based tokens) based solely on the multimedia content. When developing an autotagging system, three important design decisions are (1) selecting a vocabulary of tags, (2) choosing a feature-based representation of the multimedia content, and (3) picking a supervised learning framework. If we select a tag that cannot be consistently used to annotate multimedia data based on the multimedia content alone (e.g., inconsistent human annotation), or if the feature representation does not encode the information necessary to annotate the multimedia content, then it is unlikely that the supervised learning framework will be able to successfully annotate novel multimedia content with that tag.;This paper proposes an approach to select a vocabulary of tags based on sparse canonical component analysis (sparse CCA). That is, sparse CCA is used to find a set of "acoustically meaningful" tags that are correlated with a chosen feature-based representation of multimedia content. As a result, we find that we are better able to model the selected tags using our supervised autotagging system. In this paper, we specifically focus on music since we are interested in building a content-based music annotation system.
机译:基于内容的自动标记系统是一种计算机系统,其仅基于多媒体内容自动使用标记(语义上有意义的基于文本的标记)对多媒体数据(例如音乐,图像和视频)进行注释。在开发自动标记系统时,三个重要的设计决策是:(1)选择标签词汇;(2)选择多媒体内容的基于特征的表示形式;以及(3)选择监督学习框架。如果仅基于多媒体内容(例如,不一致的人类注释)选择不能一致地用于注释多媒体数据的标签,或者如果特征表示未对注释多媒体内容所必需的信息进行编码,则监督学习框架将能够使用该标签成功注释新颖的多媒体内容。;本文提出了一种基于稀疏规范成分分析(sparse CCA)的标签词汇选择方法。也就是说,稀疏CCA用于查找与“选定的基于特征的多媒体内容表示形式”相关的“听觉上有意义的”标签集合。结果,我们发现我们可以使用监督的自动标记系统更好地对所选标记建模。在本文中,我们特别关注音乐,因为我们有兴趣构建基于内容的音乐注释系统。

著录项

  • 作者

    Torres, David A.;

  • 作者单位

    University of California, San Diego.;

  • 授予单位 University of California, San Diego.;
  • 学科 Music.;Computer Science.;Statistics.
  • 学位 M.S.
  • 年度 2009
  • 页码 43 p.
  • 总页数 43
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 音乐;统计学;自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号