声明
致谢
摘要
第一章 绪论
1.1 研究背景、目的及意义
1.2.1 课题来源
1.2.2 本文研究思路和主要研究内容
1.2.3 内容组织
1.3 本章小结
第二章 网页时间抽取相关研究综述
2.1 相关工作
2.1.1 Web信息抽取概述
2.1.2 命名实体识别概述
2.1.3 网页时间抽取研究现状
2.2 网页时间抽取的难点
2.3 网页时间抽取的评价体系
2.4 本章小结
第三章 基于规则的在线Web新闻发表时间抽取方法研究
3.1 概述
3.2 规则设计
3.2.1 新闻发表时间正则表达式
3.2.2 时间节点抽取的限定条件
3.3 基于规则的在线Web新闻发表时间抽取方法
3.3.1 抽取模型
3.3.2 基于新闻链接URL抽取发表时间
3.3.3 基于DOM树文本节点抽取发表时间
3.3.4 抽取算法PTER
3.4 实验与分析
3.4.1 实验数据集与评估指标
3.4.2 对比实验
3.4.3 实验结果与分析
3.5 本章小结
第四章 基于文本节点特征融合的在线Web新闻发表时间抽取方法研究
4.1 概述
4.2 文本节点特征系
4.3 文本节点特征融合
4.3.1 组合特征选择
4.3.2 组合特征融合
4.4.1 抽取算法PTENF
4.4.2 时间格式规范化
4.5 实验与分析
4.5.1 实验数据集与评估指标
4.5.2 对比实验
4.5.3 实验结果与分析
4.6 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读学位期间的学术活动及成果情况