模糊聚类在搜索引擎自动分类上的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

Web上的信息资源呈爆炸式的增长，人们查找信息越来越难。搜索引擎是其信息利用的主要工具，然而当前搜索引擎存在不足：基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性，而忽视分类；基于分类目录的搜索引擎很难动态分析Web信息。本文在分析它们不足的前期下，提出建立具有自动分类功能的搜索引擎，并尝试对这方面的部分关键技术进行研究。
　　文中首先从分析搜索引擎的种类和工作原理入手，分析当前搜索引擎存在的问题。然后分析了Web文档模糊聚类和Web超链分析技术，在此研究的基础上，进一步从下面三个方面对网页的自动分类技术做了深入研究：
　　 1）模糊聚类方法应用于Web网页的自动分类，通过计算网页与网页之间的相似度建立分类类别，动态确定网页分类划分。
　　 2）提出通过提取源网页的扩展锚文本，进行目标网页特征识别，具体分析了不同位置的锚文本扩展，以及利用XPath提取网页特征的方法，并通过实验分析其性能。
　　 3）利用模糊聚类方法结合超链分析算法对搜索引擎的检索结果自动分类，设置调节值，值的取值变化兼顾考虑分类和PR值的影响，返回的结果可以使用户比较快速地定位到所需要的高质量信息。

著录项

作者
严海兵;
展开▼
作者单位

苏州大学;

展开▼
授予单位苏州大学;
学科计算机应用技术
授予学位硕士
导师姓名崔志明;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP274.3;
关键词
模糊聚类; 超链分析; 搜索引擎; Web聚类; 自动分类; Web文档;

相似文献

中文文献
外文文献
专利

1. 搜索引擎上的自动分类技术研究 [J] . 杨洁 ,程传鹏 . 中原工学院学报 . 2007,第006期
2. 模糊聚类技术在文献自动分类系统中的应用 [J] . 楚存坤 ,李韬 . 现代情报 . 2009,第009期
3. 集成自动分类的垂直搜索引擎及其应用 [J] . 傅丽君 ,潘旭伟 ,李娜 . 情报杂志 . 2012,第012期
4. 自动分类在搜索引擎中的应用 [J] . 钟晓 . 福建电脑 . 2009,第010期
5. 中文自动分类在搜索引擎中的应用研究 [J] . 李红宇 ,刘庆江 . 计算机科学 . 2008,第005期
6. 维、哈、柯文搜索引擎中自动分类技术的应用研究 [C] . 王珍 ,维尼拉·木沙江 ,赵丽红 . 第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 . 2010
7. 基于自动分类的元搜索引擎的研究与应用 [A] . 杨才峰 . 2004

模糊聚类在搜索引擎自动分类上的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅