...
首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >Improvement of the Scalability for Web Log Mining with LCS
【24h】

Improvement of the Scalability for Web Log Mining with LCS

机译:使用LCS改进Web日志挖掘的可伸缩性

获取原文
获取原文并翻译 | 示例
           

摘要

Nowadays, information distribution via websites is one of the most important issues. Therefore, website administrators are required to understand access trends of the websites properly. We investigate a method proposed in our previous work for mining access logs with LCS (Longest Common Subsequences) to extract frequent access sequences. However, the method still has a problem of the scalability. The execution time increases for large websites. In this paper, we propose an approach of filtering sequences with a hash function to improve the performance for analyzing large websites. We evaluate the efficiency of the approach using access logs of a real website and artificial data.
机译:如今,通过网站发布信息已成为最重要的问题之一。因此,要求网站管理员正确了解网站的访问趋势。我们调查了我们先前工作中提出的一种方法,该方法用于使用LCS(最长公共子序列)挖掘访问日志以提取频繁访问序列。但是,该方法仍然具有可伸缩性的问题。大型网站的执行时间会增加。在本文中,我们提出了一种使用哈希函数过滤序列的方法,以提高分析大型网站的性能。我们使用真实网站的访问日志和人工数据评估该方法的效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号