文摘
英文文摘
声明
第1章绪论
1.1深网简介
1.1.1深网的概念
1.1.2深网的价值
1.2深网信息搜索方法
1.3选题方向及其意义
1.4论文的主要研究内容和步骤
1.5论文的结构
第2章特征解析及分类算法
2.1 HTML接口表单
2.1.1 HTML表单标签
2.1.2 HTML表单常用控件
2.2 DOM文档对象模型
2.2.1 DOM表示的HTML文档
2.2.2 DOM对HTML文档的操作
2.3分类算法
2.3.1决策树分类算法
2.3.2支持向量机
2.3.3朴素贝叶斯
2.3.4 k-近邻算法
2.3.5机器学习工具WEKA简介
2.4本章小结
第3章深网查询接口研究和识别
3.1深网信息查询的一般流程
3.2深网查询接口研究
3.2.1深网表单
3.2.2深网表单特征提取
3.3深网查询接口识别技术
3.3.1数据集的准备
3.3.2数据集的预处理
3.3.3分类模型生成
3.3.4分类准确性估计和性能度量
3.4本章小结
第4章深网查询接口识别实验
4.1实验数据收集和处理
4.2实验结果
4.2.1决策树C4.5算法实验
4.2.2支持向量机实验
4.2.3朴素贝叶斯分类器实验
4.2.4 k-近邻算法实验
4.3实验分析
第5章结论和未来工作
5.1结论
5.2未来工作
参考文献
致 谢
攻读硕士学位期间的论文和参加的项目
武汉理工大学;