基于属性的元搜索引擎的研究与实现
RESEARCH AND IMPLEMENTATION OF THE META SEARCH ENGINE BASED ON ATTRIBUTE
摘要
Abstract
第1章 绪论
1.1 课题背景
1.2 国内外研究现况
1.3 性能评估
1.4 本文研究内容及组织结构
第2章 结合权重的正向逆向匹配相结合的分词算法
2.1 分词概述
2.2 基于字符串匹配的分词算法概述
2.3 一种结合权重的正向逆向匹配相结合的分词算法
2.4 分词前的预处理过程
2.4.1 网页预处理
2.4.2 分词预处理
2.5 结合权重的正向逆向匹配相结合的分词算法的实现
2.6 测试结果及分析
2.7 本章小结
第3章 网页表示技术与特征选择
3.1 网页特征表示
3.2 特征选择方法简介
3.2.1 文档频数
3.2.2 信息增益
3.2.3 期望交叉熵
3.2.4 互信息
3.2.5 (2统计量
3.3 本章小结
第4章 网页分类的主要算法
4.1 分类算法介绍
4.1.1 线性分类器
4.1.2 统计学习分类器
4.1.3 基于实例的分类器
4.1.4 支持向量机的分类器
4.2 分类器比较分析
4.3 本章小结
第5章 系统实现与测试
5.1 系统实现
5.1.1 系统逻辑结构
5.1.2 链接提取模块
5.1.3 分词模块的设计
5.1.4 分类模块的设计
5.2 测试结果及分析
结论
参考文献
攻读学位期间发表的学术论文
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致谢
个人简历