基于fastText的问答系统用户意图识别与关键词抽取研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文针对目前文本分类处理过程复杂且耗时过长的问题，将Facebook开源的句子分类和单词特征学习模型fastText引入到中文文本分类领域中，并验证其在中文分类中的效果。实验结果显示，相对于目前主流的文本分类方法，基于fastText模型的分类方法在保证分类效果的同时，大大缩短了分类时间。问答系统是一个对应答时间要求极高的系统，缩短用户等待时间能有效改善用户体验。在上述实验基础上，本文将fastText运用到问答系统用户意图识别中，实验结果显示fastText分类结果的准确率、召回率、F1值都明显高于卷积神经网络方法，实验用时为卷积神经网络用时的1.15％。同时本文进一步探究了保证分类精度不丢失的情况下，构建等价简单分类器的最小维度值，以及提升分类准确率的参数优化规则，构建了一个模型简单，参数最优的fastText中文文本分类模型。　　本文根据闲聊类问句的关键词不明显、范围宽泛、口语化和内容较短等语言特点，通过对闲聊类问句进行关键词抽取来优化闲聊类答案的检索。使用信息熵计算公式计算出初始候选关键词集中每个词的平均信息熵H(t)，将平均信息熵的倒数作为每个顶点的初始权重对TextRank算法进行改进来抽取问句关键词，迭代计算得出每个候选关键词的权重，按照词语权重进行排序，选取排名靠前的关键词作为该方法的抽取结果。实验结果显示改进后的TextRank算法关键词抽取效果较改进前更好。　　为了进一步提高问句关键词抽取的准确率和召回率，本文将集合的思想引入到实验中，根据每种方法不同的优缺点，本文对TF-IDF方法和TextRank算法结果进行并集来扩充抽取结果中正确的关键词的数量。为了进一步提升准确率，本文将并集后的结果与改进的TextRank算法的结果取交集来过滤掉两种方法中不正确的关键词，结果表明准确率和F1值都有明显提高。本文设定交集结果关键词数量的阈值N，并在多次实验中得出使抽取效果最好的阈值N的大小。　　综上所述，本文将使用了线性分类思想的单词特征学习模型fastText应用到问答系统用户意图识别领域，通过实验验证，在保证分类准确率不丢失的情况下该模型分类速度极快，较目前分类领域主流分类方法能明显缩短分类用时。本文通过对算法改进，有效提升了问句关键词抽取效果，通过多方法融合和引入集合思想，最终实验结果显示本文提出的关键词抽取方案的抽取结果相对稳定，模型整体性能较高，验证了所提方案的可行性。

著录项

作者
代令令;
展开▼
作者单位

广西大学;

展开▼
授予单位广西大学;
学科信息安全与电子商务
授予学位硕士
导师姓名蒋侃;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
问答系统,文本分类,用户意图,关键词抽取;

相似文献

中文文献
外文文献
专利

1. 基于hadoop技术的信息系统用户体验智能识别与r分析研究 [J] . 梁林森 . 中国信息化 . 2018,第001期
2. 基于深度学习的意图识别与语义槽填充联合建模研究 [J] . 王明星 . 数字技术与应用 . 2021,第005期
3. 基于表面肌电图的人体运动意图识别研究进展 [J] . 曹梦琳 ,陈宇豪 ,王珏 . 中国康复理论与实践 . 2021,第005期
4. 基于表面肌电的意图识别方法在非理想条件下的研究进展 [J] . 李自由 ,赵新刚 ,张弼 . 自动化学报 . 2021,第005期
5. 基于制动意图识别的电动物流车换挡策略研究 [J] . 刘丽萍 ,陈金平 ,茹锋 . 微电机 . 2021,第001期
6. 基于承诺理论的享乐型信息系统用户持续使用意图研究 [C] . SUN Kai ,孙凯 ,LIU Luchuan . 信息系统协会中国分会第四届学术年会 . 2011
7. 基于fastText的问答系统用户意图识别与关键词抽取研究 [A] . 代令令 . 2018

基于fastText的问答系统用户意图识别与关键词抽取研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅