声明
摘要
第1章 引言
1.1 课题的研究背景
1.2 国内外发展现状
1.3 课题的研究意义
1.4 本文的工作和组织结构
第2章 相关工作概述
2.1 研究背景
2.2 包装器技术
2.3 基于规则的序列抽取技术
2.4 基于统计学习模型的序列标注技术
2.4.1 隐马尔可夫模型
2.4.2 最大熵马尔可夫模型
2.4.3 条件随机场模型
2.5 本章小结
第3章 基于CRFs模型的引文标注框架
3.1 基于CRFs模型的引文标注总体结构
3.2 模型学习
3.2.1 人工标注
3.2.2 结构学习
3.2.3 特征选取
3.2.4 参数估计
3.3 引文标注
3.4 本章小结
第4章 基于词组粒度的CRFs模型的处理策略
4.1 基于单词粒度的CRFs模型的弊端
4.1.1 基于单词粒度的CRFs的训练集
4.1.2 基于单词粒度的错误情况和分析
4.2 基于词组粒度的CRFs模型
4.2.1 基于词组粒度的结构学习
4.2.2 模型其他步骤的相应改变
4.3 本章小结
第5章 系统的特征选取方法
5.1 特征与特征函数
5.1.1 特征函数的分类
5.1.2 特征与特征函数的实现
5.2系统的特征选取方法
5.2.1 特征选取的要求
5.2.2 特征选取的分类
5.2.3 特征的获取方法
5.3 本章小结
第6章 系统实现与实验分析
6.1 系统介绍
6.2 算法描述
6.2.1 参数估计
6.2.2 引文标注
6.3 系统运行过程
6.4 实验分析
6.4.1 实验环境
6.4.2 实验设置
6.4.3 粒度改变对标注性能的影响实验
6.4.4 特征选取对标注的性能的影响实验
6.5 本章小结
第7章 总结与展望
7.1 本文工作总结
7.2 进一步研究的工作
参考文献
致谢
攻硕期间发表的论文及参加的项目