首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >Improvement of the Scalability for Web Log Mining with LCS
【24h】

Improvement of the Scalability for Web Log Mining with LCS

机译:用LCS改进Web日志挖掘的可扩展性

获取原文
获取原文并翻译 | 示例
           

摘要

Nowadays, information distribution via websites is one of the most important issues. Therefore, website administrators are required to understand access trends of the websites properly. We investigate a method proposed in our previous work for mining access logs with LCS (Longest Common Subsequences) to extract frequent access sequences. However, the method still has a problem of the scalability. The execution time increases for large websites. In this paper, we propose an approach of filtering sequences with a hash function to improve the performance for analyzing large websites. We evaluate the efficiency of the approach using access logs of a real website and artificial data.
机译:如今,通过网站的信息分布是最重要的问题之一。 因此,网站管理员必须妥善了解网站的访问趋势。 我们调查了我们以前的工作中提出的方法,用于使用LCS(最长公共子序列)挖掘访问日志以提取频繁访问序列。 但是,该方法仍然存在可扩展性的问题。 大型网站的执行时间增加。 在本文中,我们提出了一种利用哈希函数过滤序列的方法,以改善分析大型网站的性能。 我们使用真实网站和人工数据的访问日志评估方法的效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号