首页> 外文会议>IEEE International Conference on Acoustics, Speech, and Signal Processing >LATENT SEMANTIC RETRIEVAL OF PERSONAL PHOTOS WITH SPARSE USER ANNOTATION BY FUSED IMAGE/SPEECH/TEXT FEATURES
【24h】

LATENT SEMANTIC RETRIEVAL OF PERSONAL PHOTOS WITH SPARSE USER ANNOTATION BY FUSED IMAGE/SPEECH/TEXT FEATURES

机译:通过融合图像/语音/文本功能的稀疏用户注释具有稀疏用户注释的潜在语义检索

获取原文
获取外文期刊封面目录资料

摘要

While users prefer high-level semantic photo descriptions (e.g., who, what, when, where), we wish to minimize the need to annotate photos using such descriptions by the user. We propose a latent semantic personal photo retrieval approach using fused image/speech/text features. We use low-level image features to derive relatoionships among sparsely annotated photos, and probabilistic latent semantic analysis (PLSA) models based on fused image/speech/text features to analyze photo "topics". We then retrieve the photos using text or speech queries of simple high-level semantic words only. In preliminary experiments, while only 10percent of the photos were manually annotated, the photos could be well retrieved with very encouraging results.
机译:虽然用户更喜欢高级语义照片描述(例如,谁,谁,什么时候,在那里),我们希望尽量减少使用用户使用这些描述的照片的需要。我们提出了一种使用融合图像/语音/文本功能的潜在语义个人照片检索方法。我们使用低级图像特征来导出基于融合图像/语音/文本功能的稀疏注释的照片和概率潜在语义分析(PLSA)模型来分析照片“主题”。然后,我们使用简单的高级语义单词的文本或语音查询来检索照片。在初步实验中,虽然手动注释照片的10个照片,但照片可以很好地检索照片,结果非常令人鼓舞。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号