首页> 中文学位 >基于连续模式的OLAP查询日志挖掘及推荐
【6h】

基于连续模式的OLAP查询日志挖掘及推荐

代理获取

摘要

数据仓库(Data Warehouse,DW)及商业智能(Business Intelligence,BI)技术的快速发展,使得基于数据仓库的联机分析处理(Online analytical processing,OLAP)工具得到广泛的应用。然而数据仓库复杂性的提高使用户通过OLAP浏览和分析多维数据的过程变得越来越繁琐。面对海量数据,用户通常不能确定其下一步查询是什么。
   为了提高用户运用OLAP工具进行查询分析的效率,将查询推荐技术引入OLAP领域。本文重点研究OLAP领域下的查询推荐技术,提出了基于连续模式的OLAP查询日志挖掘及推荐方法。本文的主要研究工作和贡献如下:
   1)完善了从日志文件中提取用户操作序列的方法。当日志文件中出现后一条查询语句是前一条查询语句经过多步基本操作形成时,能记录每一步基本操作,从而为后续模式挖掘提供准确的训练数据;
   2)提出连续查询模式挖掘(Continuous Query Pattern Mining,CQPM)算法。通过频繁模式挖掘,将查询序列抽象成连续查询模式,大幅度减少了冗余查询序列,提高后续推荐的效率;
   3)提出基于查询后缀树的模糊查询模式匹配(Approximate Query PatternMatching,AQPM)算法。该算法在连续查询模式中寻找匹配当前查询序列的下一步有效查询,减少了搜索过程的复杂度,提高推荐的准确度;
   4)开发了带有推荐功能的OLAP工具。该工具中,本文提出的查询推荐方法被封装为模块,嵌入到Mondrian引擎中,改善了用户OLAP体验。通过8名OLAP分析人员在该工具下的查询日志对本文提出方法进行性能评价,实验结果表明,相较基于prefixspan的改进算法,采用CQPM算法能去除数量庞大的冗余的查询模式,AQPM算法较基本的前缀匹配算法提高了推荐的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号