文摘
英文文摘
声明
第一章 绪论
1.1 论文的研究背景及研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 论文的研究内容及主要工作
1.3 论文的组织结构
第二章 相关技术介绍
2.1 Web挖掘理论基础
2.1.1 Web挖掘定义
2.1.2 Web挖掘分类
2.2 网络爬虫
2.2.1 网络爬虫的系统结构
2.2.2 常用的网络爬虫搜索算法
2.3 中文分词
2.4 本章小节
第三章 博客搜索引擎技术介绍
3.1 搜索引擎相关理论
3.1.1 搜索引擎发展历史
3.1.2 传统搜索引擎的定义及基本构成
3.1.3 搜索引擎分类
3.1.4 特色搜索引擎
3.2 博客搜索引擎技术
3.2.1 RSS源搜索
3.2.2 TrackBack技术
3.2.3 Tag标签
3.3 本章小节
第四章 博客搜索与排名系统的详细设计
4.1 系统框架
4.2 主要功能模块介绍
4.2.1 爬虫模块
4.2.2 信息抽取模块
4.2.3 搜索排名模块
4.2.4 系统的主要功能设计
4.3 本章小节
第五章 基于内容的博客排名算法研究
5.1 概述
5.2 相关工作
5.3 基于内容的博客排名算法(Content—based Rank Algorithm)
5.3.1 隐式的链接
5.3.2 算法
5.4 实验分析
5.4.1 数据集
5.4.2 实验结果与用户评价
5.5 本章小节
第六章 总结与展望
6.1 本文工作总结
6.2 未来工作展望
致 谢
参考文献
附录攻读硕士学位期间已发表论文