一种改进的GloVe词向量表示学习方法

石隽锋; 李济洪; 王瑞波

首页> 中文期刊>中文信息学报 >一种改进的GloVe词向量表示学习方法

一种改进的GloVe词向量表示学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

GloVe模型是一种广泛使用的词向量表示学习的模型.许多研究发现,学习得到的词向量维数越大,性能越好;但维数越大,模型学习耗时越长.事实上,GloVe模型中,耗时主要表现在两方面,一是统计词对共现矩阵,二是训练学习词向量表示.该文在利用GloVe模型统计语料中词对共现时,基于对称或非对称窗口得到两个共现矩阵,然后分别学习得到较低维度的词向量表示,再拼接得到较高维度的词向量表示.从计算的复杂度来看,该文方法并不会产生多的计算量,但显然统计共现矩阵和训练学习可通过并行方式实现,能够显著提高计算效率.在使用大规模语料的实验中,以对称和非对称窗口分别统计得到共现矩阵,分别学习得到300维词向量表示,再使用拼接方式得到600维词向量表示.与GloVe模型对称和非对称的600维的词向量相比,在中文和英文的词语推断任务上,显著地提高了预测的准确率,在词语聚类任务上,有较好的聚类效果,验证了该文方法的有效性.

著录项

来源
《中文信息学报》|2021年第4期|16-22|共7页
作者
石隽锋; 李济洪; 王瑞波;
展开▼
作者单位

山西大学现代教育技术学院山西太原 030006;

山西大学现代教育技术学院山西太原 030006;

山西大学现代教育技术学院山西太原 030006;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
GloVe模型; 拼接的词向量; 词语推断任务;
入库时间 2022-08-20 04:42:11

相似文献

中文文献
外文文献
专利

1. 一种改进的带有情感信息的词向量学习方法 [J] . 张巍 ,史文鑫 ,刘冬宁 . 计算机应用研究 . 2017,第008期
2. 基于GloVe模型的词向量改进方法 [J] . 陈珍锐 ,丁治明 . 计算机系统应用 . 2019,第001期
3. 基于fastText模型的词向量表示改进算法 [J] . 阴爱英 ,吴运兵 ,郑一江 . 福州大学学报（自然科学版） . 2019,第003期
4. 一种多基元联合训练的藏文词向量表示方法 [J] . 才智杰 ,才让卓玛 ,孙茂松 . 中文信息学报 . 2020,第005期
5. 一种基于Hownet的词向量表示方法 [J] . 陈洋 ,罗智勇 . 北京大学学报：自然科学版 . 2019,第1期
6. 基于知网义原词向量表示的无监督词义消歧方法 [C] . TANG Gongbo ,唐共波 ,YU Dong . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 基于对抗训练的跨语言词向量学习方法研究 [A] . 李玉玲 . 2020

一种改进的GloVe词向量表示学习方法

摘要

著录项

相似文献

相关主题

期刊订阅