声明
论文说明
摘要
1 引言
1.1 研究背景和意义
1.2 国内外研究现状
1.3 本文研究的问题和内容
1.4 本文的组织结构
2 相关技术研究
2.1 HTML语言介绍
2.2 DOM技术研究
2.2.1 DOM结点的分类
2.2.2 DOM树结构及其操作
2.3 网页中的视觉信息
2.4 基于视觉信息的页面分割算法
2.5 小结
3 基于JS的CEF功能的扩展
3.1 问题的描述
3.2 浏览器控件
3.2.1 WebBrowser
3.2.2 CEF框架
3.2.3 WebBrowser和CEF对比试验
3.3 利用JS获取页面的视觉信息
3.4 在CEF中访问页面结点
3.5 小结
4 基于CEF的VIPS算法的实现
4.1 问题的描述
4.2 视觉块抽取
4.2.1 内容一致度DoC以及PDoC
4.2.2 结点的分类
4.2.3 视觉块抽取算法
4.3 分隔条探测
4.3.1 分隔条探测算法
4.3.2 分隔条权重
4.4 内容结构构建
4.4.1 内容结构构建算法
4.4.2 内容结构构建示例
4.5 算法设计中的问题
4.6 实验结果与分析
4.7 小结
5 总结和展望
5.1 总结
5.2 展望
参考文献
致谢
个人简历
中国海洋大学;