封面
中文摘要
英文摘要
目录
第1章 绪 论
1.1 课题研究的目的和意义
1.2 国内外研究和综述
1.3 课题研究内容
1.4 本文结构安排
第2章 Web文章页面分块与信息抽取的相关知识
2.1 Web文章模型
2.2 页面特征与页面分块算法相关概念
2.3相关分类聚类算法
2.4性能评价指标
2.5 本章小结
第3章 Web文章的正文识别方法
3.1 页面分块算法设计
3.2 Web文章的正文识别方法设计
3.3实验结果与分析
3.4本章小结
第4章 Web文章辅助信息的识别方法
4.1 Web文章标题的识别
4.2 Web文章摘要的识别
4.3 Web文章插图及其小标题的识别
4.4 Web文章相关链接列表的识别
4.5实验结果与分析
4.6本章小结
第5章 Web文章信息自动抽取系统
5.1 系统功能目标
5.2 系统总体设计
5.3 系统模块详细设计
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
声明
致谢