摘 要
ABSTRACT
目 录
Contents
第 1 章 绪论
1.1 课题背景及意义
1.2 国内外研究现状
1.2.1 共指消歧研究现状
1.2.2 时间信息处理研究现状
1.2.3 文本聚类研究现状
1.3 本文的研究内容
1.4 本文的内容安排
第 2 章 基于多分类器投票的中文共指消歧
2.1 引言
2.2 共指消歧问题描述
2.3 中文共指消歧策略
2.3.1 分类实例的生成
2.3.2 特征选择
2.3.3 多分类器投票
2.4 实验与分析
2.4.1 实验数据与评价体系
2.4.2 结果与分析
2.5 本章小结
第 3 章 基于决策模型的中文共指消歧
3.1 引言
3.2 共指消歧问题分类
3.3 先验知识库构建
3.4 共指关系判断
3.4.1 共指候选项特征抽取
3.4.2 子问题规则集
3.5 实验与分析
3.5.1 实验设置
3.5.2 结果与分析
3.6 本章小结
第 4 章 基于时间信息共指消歧的搜索结果排序
4.1 引言
4.2 时间表达式识别
4.3 时间表达式标准化
4.4 搜索结果排序
4.4.1 查询时间信息提取
4.4.2 网页事件时间信息提取
4.4.3 查询与事件的时间信息共指关系判断
4.4.4 搜索结果排序方法
4.5 实验与分析
4.5.1 实验设置
4.5.2 评测指标
4.5.3 结果与分析
4.6 本章小结
第 5 章 基于共指消歧的多特征组合事件发现
5.1 引言
5.2 新闻文本特征提取与组合
5.2.1 文本特征提取
5.2.2 时间特征提取
5.2.3 词典特征提取
5.2.4 相似度加权
5.3 基于共指消歧的特征补全
5.4 文本聚类方法描述
5.5 实验与分析
5.5.1 实验设置
5.5.2 结果及分析
5.6 基于异构信息的事件推荐
5.7 本章小结
结 论
参考文献
攻读博士学位期间发表的学术论文及其它成果
哈尔滨工业大学学位论文原创性声明及使用授权
致 谢
个人简历