首页> 外文期刊>Document Numerique >Tag relatedness in image folksonomies
【24h】

Tag relatedness in image folksonomies

机译:图像民俗分类中的标签相关性

获取原文
获取原文并翻译 | 示例
       

摘要

Folksonomies - Les réseaux sociaux, les ressources disponibles sur le web et les tags utilisateurs qui y sont associés permettent de facilement récupérer, organiser du contenu et naviguer sur le web. Cependant, leurs avantages restent limités, principalement à cause du caractère bruité des tags proposés par les utilisateurs. Pour pallier cette difficulté, nous proposons une méthode pour regrouper les tags similaires dans une folksonomie : les cooccurrences entre tags et le "Laplacian Score" sont utilisées pour définir, pour chaque tag, une distribution de probabilité empirique ; les lags supposés liés sont identifiés selon les similarités entre leurs distributions. Dans ce but, nous présentons une variante de la divergence de Jensen-Shannon, plus résistante au bruit. Nous évaluons notre approche expérimentalement à l'aide de WordNet et la comparons à une méthode classique de recherche de similarité entre tags, basée sur la similarité cosinus. Les résultats de notre évaluation montrent l'efficacité de notre approche et ses avantages par rapport aux méthodes concurrentes.%Folksonomies - networks of users, resources, and tags allow users to easily retrieve, organize and browse web contents. However, their advantages are still limited mainly due to the noisiness of user provided tags. To overcome this issue, we propose an approach for characterizing related tags in folksonomies: we use tag co-occurrence statistics and Laplacian score based feature selection in order to create empirical co-occurrence probability distribution for each tag; then we identify related tags on the basis of the dissimilarity between their distributions. For this purpose, we introduce variant of the Jensen-Shannon Divergence, which is more robust to statistical noise. We experimentally evaluate our approach using WordNet and compare it to a common tag-relatedness approach based on the cosine similarity. The results show the effectiveness of our approach and its advantage over the competing method.
机译:Folksonomies-社交网络,Web上可用的资源以及相关的用户标签,使您可以轻松地检索,整理内容和浏览Web。然而,它们的好处仍然有限,主要是因为用户提供的标签的嘈杂性质。为了克服这一困难,我们提出了一种在民俗分类法中将相似标签分组的方法:标签与“拉普拉斯分数”之间的共现用于为每个标签定义经验概率分布;根据它们之间分布的相似性来确定所谓的联系滞后。为此,我们提出了Jensen-Shannon发散的一种变体,它更耐噪声。我们使用WordNet通过实验评估我们的方法,并将其与基于余弦相似度的经典方法(用于在标签之间寻找相似度)进行比较。我们的评估结果表明了我们的方法的有效性及其相对于竞争方法的优势。%Folksonomies-用户,资源和标签的网络使用户可以轻松地检索,组织和浏览Web内容。然而,它们的优点仍然主要由于用户提供的标签的嘈杂而受到限制。为了克服这个问题,我们提出了一种在民俗分类法中表征相关标签的方法:我们使用标签共现统计和基于拉普拉斯分数的特征选择,以便为每个标签创建经验共现概率分布。然后我们根据相关标签之间的差异来识别相关标签。为此,我们引入了Jensen-Shannon发散的变体,它对统计噪声更加健壮。我们使用WordNet通过实验评估了我们的方法,并将其与基于余弦相似度的通用标签相关性方法进行了比较。结果表明我们的方法的有效性及其相对于竞争方法的优势。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号