云分类学术搜索引擎的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网信息的发展，搜索引擎技术已经越来越成熟。海量的网页信息、良莠不齐的网页质量，对于需要学术信息的专业用户来说无疑降低了检索体验。目前，专业的学术搜索引擎，已经成为研究的一个热点。但是现有的这些学术搜索引擎，存在或多或少的缺点，比如不能免费下载原文、用户不能推荐刊源等。并且一些小型学术搜索引擎采用集中式体系结构，系统对主机要求比较高，若主机出现故障，可能导致全网停止工作。
　　本研究从用户实际需求出发，设计了一个云分类学术搜索引擎，一个具有学术性的、可免费获取原文的、满足用户个人偏好的、可分类检索的、服务稳定的云分类学术搜索引擎。本文首先介绍了云搜索引擎的相关技术，分析和研究了Hadoop分布式计算平台和开源搜索引擎Nutch；其次分析和获取了具有学术性的免费期刊网站的URL，设定了本文的刊源数据库，同时满足了用户可以根据个人偏好推荐刊源和可以免费获取原文的需求；接着设计和实现了分布式网络信息获取功能，对爬取回来的网页内容采用IK-Analyzer进行分词处理；然后对爬取回来的网页进行学术性判断，本文采用向量空间模型（VSM）进行学术性判断；最后采用中图法和朴素贝叶斯（Na?ve Bayes）分类算法实现了学术网页分类的功能。此外本文对实验结果进行测试分析，证明该搜索引擎准确率高、检索速度快，能较好的满足用户希望免费获取学术原文和进行刊源定制的需求，从而说明本搜索引擎具有十分重要的应用价值。

著录项

作者
曾盼盼;
展开▼
作者单位

长安大学;

展开▼
授予单位长安大学;
学科交通信息工程及控制
授予学位硕士
导师姓名王卫亚;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
云搜索引擎; 向量空间模型; 学术网页分类;

相似文献

中文文献
外文文献
专利

1. 基于分类的智能搜索引擎研究与实现 [J] . 程传鹏 . 中原工学院学报 . 2010,第003期
2. 基于决策树分类的云作业调度算法研究与实现 [J] . 强彦 ,卢军佐 ,裴博 . 太原理工大学学报 . 2012,第006期
3. 网络分类搜索引擎与传统分类法之比较分析--兼论建立我国信息组织分类标准 [J] . 邓均华 . 河南图书馆学刊 . 2001,第005期
4. 国外网络搜索引擎优秀资源现状述评——搜索引擎网站、论坛、新闻和学术会议资源 [J] . 赵金海 ,赵西安 . 现代情报 . 2008,第001期
5. 农业分类搜索引擎及其分类体系研究综述 [J] . 罗德一 . 湖北经济学院学报：人文社会科学版 . 2009,第009期
6. 网络分类搜索引擎与传统分类法之比较分析——兼论建立我国信息组织分类标准 [C] . 邓均华 . 庆祝中国科技信息事业创建45周年学术研讨会 . 2001
7. 基于云平台的中英文分类学术搜索引擎研究与实现 [A] . 赵冰漫 . 2019

云分类学术搜索引擎的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅