基于长短时记忆网络的多标签文本分类

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

分类问题一直以来都是人工智能领域的核心问题，随着文本内容的丰富，文本的语义呈现出多角度、多标签的特征，为了自动化地索引和管理这些内容，多标签文本分类问题变得重要起来。尽管文本分类技术已经得到了广泛研究，但随着标签个数的增加，多标签文本分类问题的复杂程度会指数增长，以至于传统技术无法很好地满足需求。
　　本研究主要内容包括：⑴分析了传统算法的缺陷，提出了基于词向量的层次化长短时记忆网络模型，分别在句子和文档层面对文本进行建模，从而得到整个文档的向量化表达。⑵提出了两个对文本进行多标签分类的策略。一个基于多项逻辑回归对标签进行排序，再利用动态阈值调整技术得到预测结果;另一个利用了标签之间的结构特征构建了一棵标签树，训练了多个分类器在标签树上进行联合预测，还提出了多个联合预测的准则。⑶在纽约时报的新闻数据集上，文本设计了多个对比实验将算法与基准模型在多个指标上进行了对比。除此之外，设计了多个实验探究模型在标签树上进行联合预测时，不同预测准则对模型性能的影响。

著录项

作者
熊涛;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机科学与技术
授予学位硕士
导师姓名庄越挺,吴飞,汤斯亮;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
文本数据库; 标签分类; 语义分析; 程序语言;

相似文献

中文文献
外文文献
专利

1. 基于双通道双向长短时记忆网络的铁路行车事故文本分类 [J] . 韩广 ,卜桐 ,王明明 . 铁道学报 . 2021,第009期
2. 基于Word2Vec词嵌入和双向长短时记忆网络的文本分类实现 [J] . 王玲 . 电子技术与软件工程 . 2020,第015期
3. 基于标签语义注意力的多标签文本分类 [J] . 肖琳 ,陈博理 ,黄鑫 . 软件学报 . 2020,第004期
4. 基于标签语义相似的动态多标签文本分类算法 [J] . 姚佳奇 ,徐正国 ,燕继坤 . 计算机工程与应用 . 2020,第019期
5. 基于多任务的多标签文本分类 [J] . 覃杰 . 现代计算机（专业版） . 2021,第014期
6. 标签特征和正文特征融合的SVM博客文本分类算法研究 [C] . 刘秉权 ,李博 ,孙林 . 第六届全国信息检索学术会议 . 2010
7. 基于主题特征的多标签文本分类方法研究 [A] . 陈文实 . 2021

基于长短时记忆网络的多标签文本分类

目录

摘要

著录项

相似文献

相关主题

期刊订阅