封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1 研究背景
1.2 Web信息抽取研究现状
1.3 论文的组织结构
第二章 相关技术
2.1 Web信息抽取技术
2.2 自动机技术
2.3 HTML、XHTML 和XML
2.4 本章小结
第三章 信息抽取的方法和算法
3.1 预处理
3.2 将无秩树转化为有秩树
3.3 抽取方法
3.4 树自动机推理算法
3.5 系统设计目标
3.6 Web文档准备阶段
3.7 Web文档信息抽取阶段
3.8 本章小结
第四章 实验结果及其分析
4.1 基准数据集的测试
4.2 大型数据集中的测试
4.3 本章小结
第五章 论文总结与展望
5.1 总结
5.2 展望
参考文献
个人简历 在读期间发表的学术论文
致谢
华东交通大学;