基于深度学习的问题分类组合模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

自动问答系统允许用户以自然语言进行提问，并返回给用户精确的回答。随着语义分析等自然语言处理技术、大数据等相关技术的发展，在智能客服等实际应用的需求之下，自动问答系统成为一个研究热点。
　　开放域问答系统通常包括问题理解、信息检索与答案生成三大主要模块。问题理解是问答系统处理用户输入的第一步，问题分类(Question Classification，QC)就是问题理解步骤中的关键一环，问题分类是指根据问题所对应的答案类型来将问题分为不同的类别。问题分类提供了候选答案中需要进行下一步精确定位和验证处理的答案类型的约束，其次，问题分类提供后续过程中可能用于决定采取何种答案选择策略的信息。问题分类准确性将直接影响到问答系统后续多种策略的制定，最终影响抽取的答案的准确性，因此问题分类成为自动问答系统研究中的基础任务。
　　目前中文问题分类任务的主要解决方案仍集中于传统方法，包括朴素贝叶斯、支持向量机等，深度学习方法的研究仍然比较匮乏，本文在此背景下，提出了一种基于深度学习的问题分类组合模型，论文的主要工作如下:
　　针对中文问题分类任务，本文设计了一个基于深度学习的组合模型，模型中同时引入字符向量与词向量，同时在模型中对二者采用不同的处理方式，使用LSTM模型处理词向量，使用卷积和池化操作处理字符向量，原因如下:
　　首先，在模型中同时使用字符向量与词向量，二者相互促进。字符向量与词向量都是当前的深度学习方法中常用的特征，然而大多模型只选用其一，本文认为，字符向量与词向量共同使用能够起到很好的互补作用，词向量为完整的语素，包含完整的语义信息，然而由于分词技术的不完善，存在由分词错误引发的语义错误或语义缺失;字符向量有效地避免了由于分词出现的错误，然而由于中文语素并不见得是单字，所以字符向量实际上破坏了语素的完整性，这就需要词向量的补充。在此考虑下，本文模型同时引入了字符向量与词向量，二者相互促进，提升了模型的性能。
　　其次，采用不同的方式提取词向量与字符向量不同维度的特征，多角度对问题进行表示。模型分别使用LSTM和CNN提取中文问句的词语级特征和字符级特征，并对两类特征进行组合，使用组合后的多角度特征作为原问句的特征向量进行分类。
　　在实现本文设计的模型后，本文进行了一系列对比实验，对比对象包括传统机器学习方法（朴素贝叶斯、支持向量机）和基础机器学习方法（卷积神经网络、循环神经网络等），以及其他对于词向量和字符向量不同的处理方式对比实验。本文模型在哈工大语料集上取得了93.13％的准确率，一系列的实验结果均证明了本文模型设计的合理性、科学性与有效性。
　　通过本文的研究，本文成功地将深度学习引入到问题分类领域，并取得了较好的结果，为如今技术飞速发展的时代解决问题分类提供了一种可行的思路，同时对问题分类的进一步研究也有一定的借鉴意义。

著录项

作者
刘洋;
展开▼
作者单位

华中师范大学;

展开▼
授予单位华中师范大学;
学科软件工程
授予学位硕士
导师姓名何婷婷;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
自动问答系统; 问题分类; 深度学习; LSTM模型; CNN模型;

相似文献

中文文献
外文文献
专利

1. 基于深度学习的问题分类方法研究 [J] . 李超 ,柴玉梅 ,南晓斐 . 计算机科学 . 2016,第12期
2. 基于组合深度学习模型的突发事件新闻识别与分类研究 [J] . 宋英华 ,吕龙 ,刘丹 . 情报学报 . 2021,第002期
3. 基于BERT+BiLSTM+CRF深度学习模型和多元组合数据增广的渔业标准命名实体识别 [J] . 杨鹤 ,于红 ,刘巨升 . 大连海洋大学学报 . 2021,第004期
4. 基于BERT+BiLSTM+CRF深度学习模型和多元组合数据增广的渔业标准命名实体识别 [J] . 杨鹤 ,于红 ,刘巨升 . 大连海洋大学学报 . 2021,第004期
5. 基于深度学习的组合体航天器模型预测控制 [J] . 康国华 ,金晨迪 ,郭玉洁 . 宇航学报 . 2019,第011期
6. 基于改进贝叶斯模型的问题分类 [C] . 张宇 ,刘挺 ,文勖 . 第一届全国信息检索与内容安全学术会议 . 2004
7. 基于深度学习模型的问题分类 [A] . 夏威 . 2018

基于深度学习的问题分类组合模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅