【24h】

Utilizing Microblogs for Web Page Relevant Term Acquisition

机译:利用MicroBlogs进行网页相关术语收购

获取原文

摘要

To allow advanced processing of information available on the Web, the web content necessitates semantic descriptions (metadata) processable by machines. Manual creation of metadata even in a lightweight form such as (web page) relevant terms is for us humans demanding and almost an impossible task, especially when considering open information space such as the Web. New approaches are devised continuously to automate the process. In the age of the Social Web an important new source of data to mine emerges - social annotations of web content. In this paper we utilize microblogs in particular. We present a method for relevant domain terms extraction for web resources based on processing of the biggest microblogging service to date - Twitter. The method leverages social characteristics of the Twitter network to consider different relevancies of Twitter posts assigned to the web resources. We evaluated the method in a user experiment while observing its performance for different types of web content.
机译:为了允许在Web上提供的信息的高级处理,Web内容需要由机器处理的语义描述(元数据)。即使以轻量级形式,诸如(网页)相关术语的手动创建也适用于美国人类要求和几乎是一个不可能的任务,尤其是考虑Web等开放信息空间时。新方法不断设计以自动化该过程。在社交网络的时代,挖掘的一个重要数据来源 - 网上内容的社会注释。在本文中,我们特别利用微博。我们在迄今为止 - Twitter的最大微博服务的处理中介绍了用于Web资源的相关域名提取的方法。该方法利用Twitter网络的社交特征,以考虑分配给Web资源的Twitter帖子的不同相关性。我们在用户实验中评估了该方法,同时观察其对不同类型的Web内容的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号