声明
摘要
表格索引
插图索引
第一章 绪论
1.1 研究背景
1.2 研究历史与现状
1.3 自动文摘系统的评测方法
1.3.1 基于Pyramid方法的内容评测
1.3.2 其他评测指标
1.3.3 基于ROUGE的自动评测
1.3.4 基于BE的自动评测
1.4 论文主要工作
1.4.1 研究意义
1.4.2 研究内容
1.4.3 课题来源
1.5 论文组织结构
第二章 基于LDA的主题建模
2.1 引言
2.2 任务定义
2.2.1 方法概述
2.3 识别主题
2.3.1 实体主题模型
2.3.2 模型推断
2.3.3 同其他模型的比较
2.4 生成句子模式
2.5 实验结果与分析
2.5.1 数据集
2.5.2 定量评估
2.5.3 定性评估
2.6 模板应用实例
2.6.1 句子排序
2.6.2 句子选择
2.6.3 方法评价
2.7 相关研究工作
2.8 本章小结
第三章 基于事件主题模型的自动文摘
3.1 引言
3.2 基于新闻事件主题模型的句子聚类
3.2.1 新闻事件的主题模型
3.2.2 模型推断
3.3 句子排序
3.4 句子压缩
3.5 句子选择
3.6 实验结果与分析
3.6.1 数据集
3.6.2 文摘质量
3.6.3 面向主题的句子聚类的质量
3.6.4 句子压缩的质量
3.7 相关研究工作
3.8 本章小结
第四章 基于语言生成模型的自动文摘
4.1 引言
4.2 基于语言生成模型的句子重构算法
4.2.1 抽取信息元
4.2.2 利用信息元生成句子
4.2.3 句子选择
4.3 实验结果与分析
4.4 相关研究工作
4.5 本章小结
第五章 跨媒体互补性自动文摘
5.1 引言
5.2 相关工作
5.3 问题定义
5.4 学习互补关系
5.4.1 度量公共性和差异性
5.4.2 跨数据集主题方面模型(ccTAM)
5.4.3 模型推断
5.5 生成互补式文摘
5.5.1 跳跃概率
5.5.2 句子排序
5.5.3 文摘生成
5.6 实验结果与分析
5.6.1 数据收集
5.6.2 基准方法
5.6.3 实验结果分析
5.7 本章小结
第六章 自动文摘更新过程中的蕴含识别
6.1 文本蕴含识别的定义
6.2 案例分析
6.3 基于机器学习的文本蕴含识别系统
6.3.1 预处理
6.3.2 知识库
6.3.3 基于Struct-SVM的RTE
6.3.4 基于最大熵的RTE
6.4 实验结果与分析
6.5 相关研究工作
6.6 本章小结
全文总结与展望
6.7 总结
6.8 展望
参考文献
致谢
攻读博士学位期间已发表论文