首页> 中文学位 >基于短文本的Web日志挖掘系统的设计与实现
【6h】

基于短文本的Web日志挖掘系统的设计与实现

代理获取

目录

第一个书签之前

图目录

表目录

第一章 绪 论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 论文主要工作

1.4 论文的组织结构

第二章 相关理论及技术研究

2.1 数据挖掘技术的研究

2.1.1 数据挖掘的定义及常用技术

2.1.2 数据挖掘流程

2.2 Web日志挖掘技术研究

2.3.1 短文本相关简介

2.3.2 文本表示模型

2.3.3 文本聚类

2.3.4 文本主题描述

2.4 系统总体分析及设计

2.5 本章小结

第三章 基于MB-kmeans++算法的用户会话聚类

3.1 日志数据预处理

3.2.1 用户会话识别

3.2.2 用户行为相似性计算方法

3.2.3 Web页面的相似性度量

3.2.4 加权的用户离散访问矩阵构造

3.2.5 用户会话相似性度量

3.3 改进的k-means算法

3.3.1 k-means算法介绍

3.3.2 k-means++算法初始选点策略

3.3.3 基于少量抽样的kmeans++改进算法

3.4 基于MB-kmeans++算法的Web用户会话聚类

3.5 实验结果分析

3.5.1 实验数据集

3.5.2 聚类结果分析

3.6 本章小结

第四章 基于融合BTM主题模型的日志挖掘

4.1 文本预处理

4.1.1 分词技术

4.1.2 去掉停用词

4.2 BTM主题模型

4.2.1 BTM模型原理

4.2.2 Gibbs采样

4.3.1 短文本向量表示

4.3.2 TF-IDF加权原理

4.3.3 文本相似度计算

4.4 基于主题结构优化的聚类算法

4.5 基于融合BTM模型的短文本主题聚类

4.6 实验结果分析

4.6.1 实验数据集

4.6.2 实验结果分析

4.7 本章小结

第五章 系统实现及验证分析

5.1 系统平台设计

5.1.1 系统总体框架

5.1.2 模块结构设计

5.2 系统实现

5.2.1 日志数据存储

5.2.2 日志预处理

5.2.3 用户会话聚类

5.2.4 短文本聚类

5.3 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

致 谢

参考文献

攻读硕士学位期间取得的研究成果

展开▼

著录项

  • 作者

    李泽华;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 贾宇明;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    文本; Web日志挖掘; 系统;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号