基于本体的Web页面分类挖掘

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Web是一个巨大的、广泛分布的全球化信息仓库,它提供了新闻、财经、广告、商务、文化、教育等多方面的信息服务.如何有效地帮助用户从Web上发现他们感兴趣的资源,已经成为一个迫切需要解决的课题.论文首先介绍了Web挖掘的一些基本概念、方法和技术,阐述了什么是Web挖掘,为什么要进行挖掘.研究了基于主题特征词和统计学知识的Web页面分类挖掘的一般过程和方法.作者针对一个已有的系统进行分析,指出了该方法的局限性——在学习阶段对于训练集依赖性大,导致在训练集不足的情形下分类的精度不高.针对基于主题特征词和统计学知识的Web页面分类挖掘的缺陷提出了基于本体的Web页面分类挖掘模型.该模型利用本体来表述已有知识,在此基础上对解析后的页面采用多种匹配方法进行信息抽取,并结合三个算法来计算页面与本体的相关度,来提高相关度计算的正确性,建立更为有效的分类规则,以力求提高分类的精度.建立了一个基于本体的Web页面分类挖掘原型系统,通过实验表明,这种基于本体的方法确实能够在训练集数量较小的情况下,得到较高的分类精度.同时也与原有的系统进行了对比性实验,确实证明了该方法的在训练集较小的情形下,比基于主题特征词方法的能够有更好的精度.最后对本文的工作进行了总结,并确定了进一步研究方向.

著录项

作者
马征;
展开▼
作者单位

中南大学;

展开▼
授予单位中南大学;
学科计算机应用技术
授予学位硕士
导师姓名李建华;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
Web挖掘; 本体; 分类;
入库时间 2022-08-17 11:20:49

相似文献

中文文献
外文文献
专利

1. Web使用挖掘下的Web页面层次分类技术研究 [J] . 汤亚玲 ,秦锋 . 情报学报 . 2008,第003期
2. 基于本体的Web挖掘分类方法及应用 [J] . 徐义峰 ,陈春明 . 计算机应用与软件 . 2009,第003期
3. 基于领域本体的Web页面信息抽取 [J] . 黄婵 ,罗艳梅 . 实验室研究与探索 . 2011,第001期
4. 基于本体的Web页面聚类研究 [J] . 谢红薇 ,颜小林 ,余雪丽 . 计算机科学 . 2008,第009期
5. 一种基于节点密度分割和标签传播的Web页面挖掘方法 [J] . 张乃洲 ,曹薇 ,李石君 . 计算机学报 . 2015,第002期
6. 一种基于节点密度分割和标签传播的Web页面挖掘方法 [C] . ZHANG Nai-Zhou ,张乃洲 ,LI Shi-Jun . 2012中国计算机大会 . 2012
7. 基于本体的Web页面聚类挖掘 [A] . 颜小林 . 2007

基于本体的Web页面分类挖掘

目录

摘要

著录项

相似文献

相关主题

期刊订阅