首页> 中文学位 >基于长短时记忆网络的多标签文本分类
【6h】

基于长短时记忆网络的多标签文本分类

代理获取

目录

声明

摘要

图目录

表目录

1.1 课题背景和研究意义

1.2 相关研究概述

1.2.1 多标签分类算法

1.2.2 传统文本分类算法

1.2.3 深度学习在文本处理中的应用

1.3 本文工作概述

1.4 论文组织架构

1.5 本章小结

第2章 多标签分类与文本分类

2.1 多标签分类

2.1.1 多标签分类的定义

2.1.2 多标签分类的常用方法

2.2 文本分类

2.2.1 文本分类的定义

2.2.2 文本分类的特征表达

2.2.3 文本分类的分类器选择

2.3 现实中的多标签文本分类场景

2.4 本章小结

第3章 基于长短时记忆网络的多标签文本分类方法

3.1 模型特点概述

3.2 词向量表达

3.2.1 词向量模型Word2vec

3.2.2 文本数据预处理

3.2.3 词向量初始化

3.3 层次化长短时记忆网络的构建

3.3.1 人工神经网络和递归神经网络

3.3.2 长短时记忆网络

3.3.3 层次化长短时记忆网络的构建

3.4 多标签分类策略

3.4.1 基于标签置信度排序的多标签分类策略

3.4.2 基于最优路径搜索的多标签分类策略

3.5 本章小结

第4章 实验设计与结果分析

4.1 实验数据集

4.2 实验环境

4.3 性能评价标准

4.4 对比实验和分析

4.4.1 多模型对比实验

4.4.2 不同最优路径定义对比实验

4.4.3 对标签树上每个分类器的性能分析

4.4.4 词向量训练策略对比实验

4.5 本章小结

第5章 本文多标签分类算法应用

5.1 多标签文本分类技术的应用

5.2 国家973项目中的应用

5.2.1 应用场景

5.2.2 应用方式和效果

5.3 多标签文本分类Web服务的实现

5.4 本章小结

6.1 全文总结

6.2 未来研究方向

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

分类问题一直以来都是人工智能领域的核心问题,随着文本内容的丰富,文本的语义呈现出多角度、多标签的特征,为了自动化地索引和管理这些内容,多标签文本分类问题变得重要起来。尽管文本分类技术已经得到了广泛研究,但随着标签个数的增加,多标签文本分类问题的复杂程度会指数增长,以至于传统技术无法很好地满足需求。
  本研究主要内容包括:⑴分析了传统算法的缺陷,提出了基于词向量的层次化长短时记忆网络模型,分别在句子和文档层面对文本进行建模,从而得到整个文档的向量化表达。⑵提出了两个对文本进行多标签分类的策略。一个基于多项逻辑回归对标签进行排序,再利用动态阈值调整技术得到预测结果;另一个利用了标签之间的结构特征构建了一棵标签树,训练了多个分类器在标签树上进行联合预测,还提出了多个联合预测的准则。⑶在纽约时报的新闻数据集上,文本设计了多个对比实验将算法与基准模型在多个指标上进行了对比。除此之外,设计了多个实验探究模型在标签树上进行联合预测时,不同预测准则对模型性能的影响。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号