首页> 中文学位 >受限域问答系统问句分类方法研究
【6h】

受限域问答系统问句分类方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1问答系统概述

1.2问句分类的研究意义

1.3国内外研究现状

1.4本文的研究内容

1.5本文的组织

第二章 中文问句分类相关理论

2.1问句分类概述

2.2问句特征抽取

2.3问句分类方法

2.4领域问句分类的特殊性

第三章 基于词关联网络的领域问句特征权重计算

3.1问句表示

3.2基于统计信息的特征权重计算方法

3.3基于词关联网络的特征权重计算方法

3.4 本章小结

第四章 基于二次贝叶斯分类模型的领域问句分类算法

4.1特征项选取

4.2二次贝叶斯问句分类算法

4.3实验结果与分析

4.4本章小结

第五章 总结与展望

5.1工作总结

5.2工作展望

致谢

参考文献

附录

作者在读期间发表的学术论文及参加的科研项目

展开▼

摘要

受限域问答系统是自动问答系统的一种,相对于开放域问答系统更具实用性和可行性而成为自然语言处理领域的研究热点。受限域问答系统通常包含三个部分:问句分析、信息检索和答案抽取。问句分类是问句分析中的一个重要模块,对问句进行分类,可以减少检索范围而提高其效率,且类别信息可以指导答案抽取策略,因此问句分类的性能直接影响问答系统的性能和质量。问句分类包括问句预处理、问句表示、特征选取、特征权重计算、分类算法设计等处理流程,其中特征选取、特征权重计算和分类算法的设计是问句分类模块中的核心部分,本文主要做了以下研究工作。
  首先,本文提出了一种基于词关联网络的领域问句特征权重计算方法。该方法针对目前特征权重计算方法都是基于统计信息而不考虑语义信息的缺点,结合受限域的特点,利用《同义词词林(扩展版)》计算同类问句集合中词语间语义相似度,将语义相似度作为路径构建词关联网络,并根据网络系统中节点重要性理论与TF-IDF思想相结合计算领域问句特征的权重。
  其次,本文提出了一种基于改进的二次贝叶斯分类模型的领域问句分类算法。该方法采用句法信息和句法结构分析提取领域问句特征,针对受限域的特殊性对传统的贝叶斯分类器做出改进,结合基于词关联网络的领域问句权重计算方法对领域问句进行分类。
  最后,本文利用昆明理工大学智能信息处理实验室提供的旅游领域语料设计并实现多次对比实验,对提出的特征权重计算方法和分类算法进行了验证,并给出实验数据和评价结果。实验结果证明了本文方法的可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号