自动问答系统中英文问句特征抽取方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

自动问答系统的研究目标是正确地理解用户以自然语言描述的问题，进而高效、准确地反馈给用户答案。问句分类是问答系统的第一步，准确地对问句分类不仅能够有效地缩小答案搜索的范围，而且能够有效地提升答案检索的准确率。虽然自然语言处理和机器学习技术已经显著地改善了问句分类的水平，但问句分类的性能及准确率仍有待进一步提高。
　　问句特征是影响问句分类效果的关键因素，因此特征抽取是问句分类的关键步骤。本文提出了一种改进的基于信息增益模型的问句单词语义特征抽取方法。首先利用WordNet计算问句中单词的语义相似度，然后结合单词的语义相似度和信息增益模型计算单词的信息增益值，根据信息增益值来评估单词的重要性，最后选取高增益值的词汇构成问句的语义特征空间。为了获取问句的词法特征，本文将问句表示为单词序列，提出了一种基于序列模式挖掘的问句频繁模式挖掘方法，得到的频繁模式构成问句的词法特征空间。
　　本文使用了三种分类器在公共的UIUC数据集上对所提方法进行了评测。实验结果表明支持向量机的分类效果要优于朴素贝叶斯分类器和C4.5分类器，基于支持向量机的大类准确率为96％，小类准确率为90％，优于现有的问句分类方法。此外，本文所提的特征抽取方法由于不需要对问句进行语法解析，因此有效地节省了计算开销。

著录项

作者
易小凯;
展开▼
作者单位

大连海事大学;

展开▼
授予单位大连海事大学;
学科软件工程
授予学位硕士
导师姓名刘亚清;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理 ;
关键词
自动问答系统; 问句分类; 特征抽取; 信息增益;

相似文献

中文文献
外文文献
专利

1. 问答系统中问句分类方法研究综述 [J] . 韩东方 ,吐尔地·托合提 ,艾斯卡尔·艾木都拉 . 计算机工程与应用 . 2021 ,第006期
2. 藏文问答系统中问句的分类方法研究 [J] . 柔特 . 计算机工程与科学 . 2015 ,第007期
3. 问答系统中意见型疑问句的分类方法研究 [J] . 程骋 ,尹航 ,王练术 . 微计算机信息 . 2009 ,第036期
4. 基于Word2vec和句法规则的自动问答系统问句相似度研究 [J] . 刘杰 ,白尚旺 ,陆望东 . 计算机应用与软件 . 2021 ,第003期
5. 自动问答系统中问句分类研究综述 [J] . 镇丽华 ,王小林 ,杨思春 . 安徽工业大学学报（自然科学版） . 2015 ,第001期
6. 基于领域本体的中文问答系统问句分析研究 [C] . 向春丞 ,穗志方 . 第六届全国青年计算语言学会议 . 2012
7. 中英文双语问答系统中问句处理的研究 [A] . 陈冰琦 . 2004

自动问答系统中英文问句特征抽取方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅