语义Web使用挖掘研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

随着Web技术的快速发展及广泛应用,Internet上的Web页面数目开始呈指数级的速度增长,如何结合语义知识来挖掘分析用户对Web页面的访问行为成为一个重要的研究方向。这里分别从用户的Web使用日志信息和Web页面内容信息着手,从语义距离计算、语义挖掘算法和结果序列的语义相似度分析这三个方面展开研究。
　　在语义距离计算方面,在已有的计算方法的基础上加入页面在日志数据中的出现概率信息,由页面在本体层次树中的深度、分支度和出现概率这三个因素共同决定结点页面的语义权值,进而得到任意两个页面间的语义距离信息。实验表明,改进后的语义权值计算方法得到的结果更加合理和全面。
　　在语义挖掘算法方面,结合Mabroukeh提出的使用语义距离来辅助挖掘的理论思想,考虑到日志数据中访问时间的有序性,以吴海燕提出的AprioriAll算法的连接条件为基础,加入改进后计算得到的语义距离信息,即在算法的连接步中除了要满足已有的连接条件外还需要考虑两个连接页面的语义距离,如果大于给定的语义距离值,则不再执行连接操作。实验表明,改进后的算法挖掘得到的频繁语义访问序列具有一定的语义相关性,算法的计算规模和执行时间也得到了一定程度的改善。
　　在结果序列的语义相似度分析方面,结合本体和本体映射的相关理论,给出一种新的页面本体的定义形式,以页面前导符的形式按照页面内容词组信息将所有的页面统一组织,通过对比前导符、词组及其他本体因素的相似度来综合得到页面内容的语义相似程度,以此来对挖掘得到的访问序列进行语义相似度的分析。

著录项

作者
王蒙蒙;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名曹忠升;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
Web页面; 序列模式挖掘算法; 语义距离计算; 结果序列; 语义相似度;

相似文献

中文文献
外文文献
专利

1. 基于盖然论潜在语义分析的Web使用挖掘 [J] . 石新景 ,汤小春 ,闫磊 . 微电子学与计算机 . 2008,第6期
2. Web使用挖掘技术研究 [J] . 高艳云 . 数字技术与应用 . 2015,第011期
3. Web使用挖掘技术研究 [J] . 高艳云 . 数字技术与应用 . 2015,第011期
4. 一种改进的基于Web使用挖掘的数据预处理方法的研究 [J] . . 安徽电子信息职业技术学院学报 . 2014,第002期
5. 基于Web使用挖掘的用户有效偏爱浏览路径研究 [J] . 黄伟建 ,冯立娟 . 科学技术与工程 . 2014,第009期
6. Web使用挖掘在医院信息网站建设中的应用研究 [C] . WANG Zhiyun ,汪志云 . 2014年华南医院信息网络大会 . 2014
7. 语义Web使用挖掘若干关键技术研究 [A] . 孙明 . 2009

语义Web使用挖掘研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅