声明
摘要
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 答案排序研究现状
1.2.2 问题检索研究现状
1.3 研究内容
1.4 本文组织结构
第2章 社区问答系统相关概念与关键技术
2.2 社区问答系统简介
2.3 基本模型
2.3.1 隐含狄利克雷分配
2.3.2 Word2vec
2.3.3 谱聚类
2.3.4 支持向量机
2.4 深度学习模型
2.4.1 卷积神经网络
2.4.2 长短时记忆网络
2.4.3 基于注意力机制的神经网络
2.5 数据集与数据预处理
2.6 评价指标
2.7 本章小结
第3章 改进主题模型
3.2 主题个数选择
3.3 传统主题模型存在的问题
3.3.1 存在垃圾主题
3.3.2 存在相似主题
3.4 改进主题模型
3.4.1 垃圾主题过滤
3.4.2 相似主题检测
3.4.3 改进主题模型效果分析
3.5 文本特征分类
3.6 实验设置与步骤
3.7 实验结果与分析
3.7.2 问题检索实验结果与分析
3.8 本章小结
第4章 基于信息增强方法的深度学习模型
4.1 引言
4.2.1 LSTM、BiLSTM建模
4.2.2 LSTM-CNN建模
4.2.3 LSTM-ATTN、BiLSTM-ATTN建模
4.3 信息增强的问题检索任务
4.4 信息增强的答案排序任务
4.5 实验设置与步骤
4.6 实验结果与讨论
4.6.1 数据清洗对CQA系统子任务的影响
4.6.2 基于信息增强的深度神经网络实验结果
4.7 本章小结
第5章 社区问答系统实现流程设计
5.2 社区问答系统面临的问题
5.3 关键技术
5.3.1 大数据处理引擎
5.3.2 文本检索引擎
5.3.3 大数据存储引擎
5.3.4 请求高可用
5.4 实现流程设计
5.4.1 整体流程设计
5.4.2 基于倒排索引的两阶段文本排序
5.4.3 基于NoSQL的文本特征实时更新
5.4.4 基于LRU的热门问题的缓存机制
5.4.5 基于Spark的实时内部答案排序和内容更新
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果