...
首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >Wikipediaに基づくWeb閲覧履歴からの潜在的興味キーワード抽出
【24h】

Wikipediaに基づくWeb閲覧履歴からの潜在的興味キーワード抽出

机译:基于Wikipedia的Web浏览历史的潜在兴趣关键词提取

获取原文
获取原文并翻译 | 示例

摘要

本論文では,ユーザのWeb閲覧履歴からユーザが普段から意識している既知の興味だけでなく,ユーザが今まで明示的には意識をしていなかった潜在的な興味の発見に導くキーワードを抽出する手法を提案する。本手法により,ユーザは検索クエリを入力することなく自分の興味分野における潜在的な興味情報の発見が可能になる。提案手法では,ブラウザアドオンを用いてユーザのWeb閲覧履歴を取得し,取得した閲覧履歴からユーザの興味対象となるキーワードを抽出する。特にユーザの潜在的な興味情報の発見につながる潜在的興味キーワードを抽出するため,閲覧文書上の出現頻度に基づぐ従来のキーワード抽出手法に加え,(1)Wikipediaのエントリ構造の解析に基づぐWikipedia上で重要とされるキーワードの抽出手法と,(2)検索エンジン上で多数のユーザから検索されるキーワードの抽出手法を提案する。評価実験の結果,提案手法では普段から興味対象と意識しているキーワードだけでなく,普段は検索するまでには至らない潜在的な興味の発見に導くキーワードを抽出でき,ユーザにそのキーワードを用いて情報検索を促すととで,自身の潜在的な興味情報が発見でることが確認された。
机译:在本文中,用户的Web浏览历史提取指示用户发现用户从未意识到的潜在利益的关键字,不仅要知道用户,不仅要知道的兴趣。提出了一种方法此方法允许用户在不进入搜索查询的情况下以其兴趣地发现潜在的兴趣信息。在所提出的方法中,使用浏览器附加获取用户的Web浏览历史,并且将关键字从获取的浏览历史中提取给用户的兴趣。特别地,为了提取导致用户的潜在兴趣信息的潜在利息关键字,除了基于观察文档的发生频率的传统关键字提取方法,(1)的分析Wikipedia的入口结构我们提出了一种关于维基百科和(2)从搜索引擎上获取许多用户检索的关键字的关键字的开采方法。由于评估实验,所提出的方法通常可以提取关键字导致潜在兴趣的发现不仅有意识,而且不仅对通常被搜索的潜在利益的发现,而且使用向用户到用户的关键字证实,它自己的潜在利息信息被发现为促进信息检索。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号