首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >Web検索のための質問キーワードの時間依存性に基づくクラスタリング手法
【24h】

Web検索のための質問キーワードの時間依存性に基づくクラスタリング手法

机译:网络搜索中问题关键字的时变聚类方法

获取原文
获取原文并翻译 | 示例
           

摘要

現在,Web検索のための検索エンジンが普及しているが,検索結果として呈示されるWebペ}ジの内容や観点は多岐にわたっていて,重要度の高いWebページがユーザの意図に合致するとは限らない.そのためWcb検索結果を解析することによって,トピックごとや関連の深いページをクラスタリングして呈示する手法がいくつか提案されている.血般に,同じトピックや関連の深いページであっても質問キーワードに関して異なる観点のWebページが混在する場合がある.一時点のWebページのみを解析する手故ではキーワードに関する観点の分析は難しく,このような問題は解決されない.そこで本研究では,時系列的な特性に基づく新たなクラスタリング方式を提案する.Webアーカイブに蓄積された過去のWebページを利用することによって,質問キーワードに関する観点の適いに基づくURLの分類を行う.手順としては,質問キーワ一ドを含むURI.を抽出し,VRL毎にキーワードの出現傾向を解析する.次にキーワードの時間依存性に基づきWebページを検索し,最後にその結果をクラスタリングして星示する.本稿では提案する手法について述べ,評価及び分析を検討する.
机译:当前,用于网络搜索的搜索引擎很广泛,但是作为搜索结果呈现的网页的内容和观点是多种多样的,并且高度重要的网页并不总是与用户的意图相匹配。缺席。因此,已经提出了几种方法,其中通过分析Wcb搜索结果来聚类和呈现与每个主题密切相关的页面。通常,在某些情况下,即使主题相同或紧密相关,但对于问题关键字具有不同观点的网页也会混杂在一起。通过一次仅分析网页来分析关键字的观点是困难的,并且这样的问题不能解决。因此,在这项研究中,我们提出了一种基于时间序列特征的新聚类方法。通过使用Web存档中累积的过去Web页面,可以根据有关问题关键字的适当观点对URL进行分类。该过程是一个包含问题关键字的URI。提取并针对每个VRL分析关键字的出现趋势。接下来,根据关键字的时间依赖性搜索网页,最后将结果聚类并加注星标。在本文中,我们描述了提出的方法并检查了其评估和分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号