文摘
英文文摘
声明
第1章引言
1.1问题的提出
1.2国内外主要研究现状
1.3论文主要研究内容
1.4论文结构
第2章理论基础
2.1自动文本分类技术
2.1.1文本的表达
2.1.2文本预处理
2.1.3索引
2.1.4统计与特征选取
2.1.5统计学习的文本分类方法
2.1.6分类性能评价
2.2强化学习基础
2.2.1强化学习简述
2.2.2强化学习Q-learning算法简介
2.2.3强化学习应用
2.3本章小结
第3章Deep Web网络爬虫系统
3.1网络爬虫技术
3.1.1网络爬虫的原理
3.1.2网络爬虫的搜索策略
3.1.3网络聚焦爬虫
3.2基于强化学习的Deep Web表单聚焦爬虫
3.2.1表单聚焦爬虫框架
3.2.2页面分类器
3.2.3链接分类器
3.2.4基于强化学习的Deep Web表单聚焦爬虫框架
3.3本章小结
第4章Deep Web数据源的分类和判别框架
4.1.Deep Web数据源分类和判别概述
4.2.Deep Web数据源的分类和判别框架
4.2.1 Deep Web数据源表单页面提取
4.2.2查询表单分类器
4.2.3领域表单分类
4.3 本章小结
第5章实验结果与分析
5.1实验数据来源与评价标准
5.2训练查询表单分类器
5.3训练表单领域分类器
5.4多分类器deep Web数据源判定与分类框架实验
5.5本章小结
第6章总结与展望
6.1工作总结
6.2工作展望
参考文献
在攻读学位期间发表的学术论文和参加科研情况
致 谢
苏州大学;