声明
摘要
第1章 绪论
1.1 研究背景
1.2 相关工作
1.2.1 问题分析
1.2.2 答案检索
1.2.3 答案抽取
1.3 本文组织结构
第2章 问答系统基础技术
2.1 问题预处理
2.1.1 分词及去除停用词
2.1.2 词性标注
2.1.3 句法分析
2.2 问题分类技术
2.2.1 类别体系
2.2.2 常用的问题分类方法
2.3 答案检索
2.3.1 基于搜索引擎的答案检索
2.3.2 检索结果页面分析
2.3.3 网页正文提取技术
2.4 相关段落检索
2.5 实体识别
2.5.1 条件随机场模型
2.6 句子相似度计算
2.7 本章小结
第3章 问题的特征选取与分类
3.1 问题数据集的构建与类别体系
3.2 构建停用词表
3.2.1 算法介绍
3.2.2 停用词表抽取结果对比
3.3 基于词的特征选取
3.3.1 基于类别信息的特征词选取
3.3.2 TFC-ICF方法的改进
3.3.3 对比实验
3.4 人工选取问句特征词
3.5 关键词扩展
3.5.1 同义词扩展
3.5.2 上位词扩展
3.5.3 关键词扩展实验
3.6 基于语法信息的特征选取
3.6.1 基于依存句法的特征选取
3.6.2 基于句法特征的实验
3.7 本章小结
第4章 事实型问题的答案抽取
4.1 句子相似度计算
4.1.1 基于向量空间模型的方法
4.2 实体识别
4.2.1 基于规则的实体识别
4.2.2 基于统计模型的实体识别
4.2.3 实体识别的实验
4.3 传统的答案抽取
4.3.1 事实型答案抽取方法
4.3.2 答案抽取实验
4.4 基于问答社区的答案抽取
4.5 本章小结
第5章 总结与展望
5.1 工作总结
5.2 未来工作
参考文献
致谢
硕士期间参与的项目及发表的论文