封面
声明
目录
中文摘要
英文摘要
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 目前研究成果的不足
1.4 研究的主要内容
1.5 文章的组织结构
第2章 WEB信息提取技术综述
2.1 WEB信息提取的发展
2.2 WEB信息提取的分类
2.3 HTML概述
2.4 XML语言
2.5 DOM概述
2.6 WEB信息提取评价指标
2.7 本章小结
第3章 基于DOM树节点重要度的扩展DOM模型
3.1 HTML标签
3.2 扩展DOM树模型
3.3 本章小结
第4章 基于扩展DOM树的WEB主题信息提取方法
4.1 页面预处理
4.2 生成扩展DOM树
4.3 扩展DOM树模型去噪
4.4 主题信息提取
4.5 本章小结
第5章实验分析及系统原型
5.1 实验环境
5.2 重要度阈值分析
5.3 提取效果评价
5.4 系统原型展示
5.5 本章小结
第6 章 总结和展望
6.1 工作总结
6.2 未来工作
参考文献
致谢
攻读硕士学位期间公开发表的论文
西南大学;