首页> 中文学位 >基于粗糙集理论的知识发现在web文本挖掘上的应用研究
【6h】

基于粗糙集理论的知识发现在web文本挖掘上的应用研究

代理获取

目录

文摘

英文文摘

第一章绪论

1.1论文的选题意义

1.2国内外研究概况

第二章数据挖掘综述

2.1数据挖掘定义和过程

2.2数据挖掘的分类

2.3 Web文本数据挖掘相关领域动态

2.4数据挖掘存在的问题

2.5数据挖掘发展的方向

2.6本章小结

第三章Rough Set方法与知识获取

3.1Rough集理论基础

3.2 Rough集理论的信息论观点描述[2]

3.3粗糙集方法评价

3.4本章小结

第四章基于Rough Set的约简和数据浓缩

4.1数据浓缩的概念

4.2数据浓缩的测量

4.3基于可辨识矩阵的属性约简策略

4.4决策表值约简策略

4.5一个数据浓缩的实例

4.6本章小结

第五章基于Rough Set的Web文本分类算法

5.1 web文本分类算法现状

5.2粗糙集应用在web文本分类中的优势

5.3基于Rough集的web文本分类系统

5.4本章小结

第六章实验过程及数据分析

6.1 Web文本挖掘系统原型WTMS

6.2系统整体设计

6.3实验结果分析和评价

6.4本章小结

第七章、总结

7.1工作小结

7.2进一步工作

参考文献

攻读学位期间发表的学术论文

致谢

展开▼

摘要

本文提出了一种基于粗糙集理论的web文本分类模型,该文提出了基于信息熵的文本关键词测度函数,通过对关键词函数值进行比较,获取对文本分类最具影响性的关键词序列;同时,针对Web上异质、非结构化信息的特点,该分类算法还考虑了超文本标记对关键词权值的影响.为获取本文项目实验材料,以配合IR(Informationretrieval)和IF(information filter)做仿真实验,我们编制了Web文本收集模型WebCrawler,该模型利用目前较流行的Hits算法解析网络链接结构,从Internet上收集相关的web文本.基于对所获实验材料的web文本分类实验,该文实现了相关的web文本挖掘算法,对提出的算法进了实验分析.

著录项

  • 作者

    罗强;

  • 作者单位

    广西大学;

  • 授予单位 广西大学;
  • 学科 控制理论与控制工程
  • 授予学位 硕士
  • 导师姓名 梁家荣;
  • 年度 2003
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.092;
  • 关键词

    web文本挖掘; 粗糙集理论; 信息熵; 函数值;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号