基于无监督学习的可持续发展目标数据分类

雷声; 黎建辉; 张丽丽

首页> 中文期刊> 《数据与计算发展前沿》 >基于无监督学习的可持续发展目标数据分类

基于无监督学习的可持续发展目标数据分类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

[目的]联合国可持续发展目标(SDGs)是联合国于2015年提出的指导全世界在2015-2030年间发展方向的目标,涵括了社会、经济、环境三个方向上的海量数据。针对SDGs标注数据少、数据量大、难以查找利用的特点,本文旨在无监督地对SDGs数据进行分类。[方法]本文首先利用结合textrank和相对词频的关键词提取算法从SDGs元数据集中提取类别描述信息,再利用基于词向量的无监督文本分类算法对SDGs数据进行了分类。[结果]在联合国官方提供的SDGs数据库上的分类实验表明,本文分类模型的F1-micro score达到了0.813,对比SeedBTM提高了33%,相较于不擅长短文本分类的STM及DescLDA上更是分别提升了39%和52%,对比使用TFIDF和textrank所提取关键词的分类效果分别提升了7%和25%。[结论]本文所提基于textrank和相对词频的关键词提取方法具有较好地可用性,且相较于目前主流的主题模型算法,本文所提基于词向量的无监督分类方法能够取得更好的效果。

著录项

来源
《数据与计算发展前沿》 |2021年第4期|104-115|共12页
作者
雷声; 黎建辉; 张丽丽;
展开▼
作者单位

中国科学院计算机网络信息中心;

北京100190;

中国科学院大学;

北京100049;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
可持续发展目标; 无监督学习; 关键词提取; 文本分类;

相似文献

中文文献
外文文献
专利

1. 基于无监督学习的可持续发展目标数据分类 [J] . 雷声 ,黎建辉 ,张丽丽 . 数据与计算发展前沿 . 2021,第004期
2. 结合无监督学习的数据流分类算法 [J] . 徐树良 ,王俊红 . 模式识别与人工智能 . 2016,第007期
3. 联合国可持续发展目标框架下中国目标数据的可获得性及进程分类研究 [J] . 邹波 ,朱婧 . 国际商务研究 . 2020,第005期
4. 基于深度无监督学习的图像分类算法 [J] . 古险峰 ,冯学晓 . 平顶山学院学报 . 2018,第002期
5. 基于聚类的朴素贝叶斯分类无监督学习方法 [J] . 葛顺 ,夏学知 . 舰船科学技术 . 2016,第001期
6. 基于朴素贝叶斯和无监督学习的数据流分类算法 [C] . Han Jie ,韩杰 ,Ni Zhi-Wei . 第十二届（2017）中国管理学年会 . 2017
7. 基于半监督和无监督学习的合成孔径雷达目标分类 [A] . 王蓝琦 . 2020

基于无监督学习的可持续发展目标数据分类

摘要

著录项

相似文献

相关主题

期刊订阅