权威Web信息在搜索优化中的应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

搜索引擎(Search engine)是指自动从Internet上搜集信息，经过一定整理以后，提供给用户进行查询的系统。它的出现给用户带来了极大的便利。但随着Internet的进一步发展，传统的搜索引擎暴露出不足之处：用户搜索出来的结果页面过多而用户真正关心的内容少，用户需要耗费极大时间寻找自己所关心的内容。基于上述问题，本文对搜索引擎及其相关技术展开研究。本文结合web文本挖掘、元搜索及其他相关技术，提出了一种基于web文本聚类的元搜索系统。系统分为两大功能模块：元搜索模块和文本聚类模块。本系统中，在用户输入关键字进行检索后，系统中的元搜索模块将调用其他全文搜索引擎进行搜索，并按照一定评分原则，去除那些与用户无关的搜索结果，并把处理后的最终结果交给文本聚类模块进行处理。在文本聚类模块中，我们首先对搜索到的web页面进行预处理，然后运用文本聚类算法对页面进行分类，生成不同的聚簇为用户的搜索提出指导性帮助。在本系统中文本聚类算法是核心。我们发现K-means算法运行速度快，时间复杂度低，而且适合在大型数据集上运行。但我们也发现,在K-means算法中不同的初始点会产生不同聚类效果。因此我们结合权威web页面的特性，选择权威web页面作为初始点进行聚类，并且很好地达到了聚类效果。

著录项

作者
王滔;
展开▼
作者单位

南昌大学;

展开▼
授予单位南昌大学;
学科计算机应用
授予学位硕士
导师姓名白似雪;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类国际互联网;
关键词
web文本挖掘; web权威信息源; 元搜索系统; 搜索引擎; 互联网;

相似文献

中文文献
外文文献
专利

1. 相关主题的最具权威的Web页搜索 [J] . 汤艳红 ,李石君 ,黄竞伟 . 计算机应用研究 . 2003,第008期
2. Web数据挖掘在校园网搜索引擎系统中的应用研究 [J] . 牛凯 . 电脑开发与应用 . 2014,第001期
3. Web数据挖掘在校园网搜索引擎系统中的应用研究 [J] . 牛凯 . 中国信息化 . 2014,第011期
4. 高校图书馆搜索引擎中Web挖掘的应用研究 [J] . 赵静 . 甘肃科技 . 2012,第023期
5. Web实体提取在垂直搜索中的应用研究 [J] . 李宏伟 ,张志远 . 新技术新工艺 . 2008,第012期
6. 基于作者权威度分析的网络社区信息搜索方法 [C] . 王智斌 ,许俭 ,周皓峰 . 第二十四届中国数据库学术会议 . 2007
7. 链接分析在权威Web信息源搜索中的应用研究 [A] . 王德生 . 2004

权威Web信息在搜索优化中的应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅