声明
摘要
第1章 绪论
1.1 课题背景及研究意义
1.2 国内外研究现状
1.2.1 互联网主流汽车站点现状研究
1.2.2 主题网络爬虫研究现状
1.3 研究内容及组织结构
1.3.1 论文主要研究内容
1.3.2 论文组织结构
1.4 小结
第2章 汽车产业链协同服务平台用户对行业信息的需求分析
2.1 汽车产业链协同平台用户对信息种类的需求分析
2.1.1 汽车行业政策法规类信息需求分析
2.1.2 汽车行业新闻类信息需求分析
2.1.3 汽车零部件价格类数据需求分析
2.2 平台中小型汽车企业获取互联网行业信息存在的问题
2.3 系统功能需求分析
2.4 小结
第3章 基于主题网络爬虫的汽车行业多元信息Web系统总体设计
3.1 汽车行业多元信息web系统设计目标
3.2 汽车行业多元信息web系统总体架构
3.3 汽车行业多元信息web系统总体功能设计
3.3.1 用户功能模块设计
3.3.2 管理员功能模块设计
3.4 数据库设计方案
3.4.1 E-R图设计
3.4.2 主要数据表格的设计
3.5 主题网络爬虫设计方案
3.6 小结
第4章 基于主题爬虫的汽车行业多元信息Web系统的关键技术的研究
4.1 主题网络爬虫工作原理
4.2 主题网络爬虫结构
4.3 网页解析
4.3.1 HTMLParser解析器
4.3.2 解析标签确立
4.4 特征词提取
4.4.主题基准模型
4.4.1 主流主题基准模型
4.4.2 本文主题基准模型方案
4.4.3 本文主题词库的建立
4.4.4 主题特征赋值
4.5 搜索策略
4.5.1 主流搜索策略的研究
4.5.2 本文搜索策略方案
4.6 小结
第五章 基于主题网络爬虫的汽车行业多元信息web系统的实现
5.1 系统开发环境
5.2 系统功能实现
5.2.1 种子站点初始化
5.2.2 网页下载模块的实现
5.2.3 网页信息抽取模块的实现
5.2.4 主题相关性判别模块的实现
5.2.5 链接控制块的实现
5.2.6 用户界面的实现
5.2.7 留言评论功能的实现
5.2.8 信息查询功能的实现
5.2.9 系统管理功能的实现
5.3 小结
总结与展望
论文总结工作
后续工作展望
致谢
参考文献