首页> 中文会议>第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 >向量模型和多源词汇分类体系相结合的词语相似性计算

向量模型和多源词汇分类体系相结合的词语相似性计算

页面导航

摘要
著录项
相似文献
相关主题

摘要

现有的词语语义相似性计算主要包括基于向量模型以及基于词汇分类体系两类方法,但这两类方法都存在自身的缺点.向量模型所依赖的文本共现中的上下文信息不等同于真正意义上的语义,而词汇分类体系方法则存在构建代价大,并且在一定程度上还不够完善的问题.本文提出一种向量模型与多源词汇分类体系相结合的词语相似性计算方法,采用多源词汇分类体系的近义词关系以及向量模型得到的词向量,计算得到词语的向量表达,并探索了不同类型词汇分类体系提供的知识的选用和融合问题,弥补了单一词向量和单一词汇分类体系在词语相似性计算中的缺点.本文采用了NLPCC-ICCPOL2016词语相似度评测比赛中的PKU500数据集进行评测.在该数据集上,本文的方法取得了0.618的斯皮尔曼等级相关系数,比NLPCC-ICCPOL2016词语相似度评测比赛第一名的方法的结果提高了19.3％.

著录项

来源
《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》|2017年|1-11|共11页
会议地点南京
作者
梁泳诗; 黄沛杰; 岑洪杰; 唐杰聪; 王俊东;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
词语相似性; 向量模型; 词汇分类体系; 组合方法; 多源融合;
入库时间 2022-08-17 11:23:56

相似文献

中文文献
外文文献
专利

1. 向量模型和多源词汇分类体系相结合的词语相似性计算 [J] . 梁泳诗 ,黄沛杰 ,岑洪杰 . 中文信息学报 . 2018,第004期
2. 基于中心向量法与万有引力模型相结合的文本分类 [J] . 王宇 ,刘斌 . 微电子学与计算机 . 2017,第11期
3. 基于向量空间模型的对外汉语应用文写作词汇分类系统研究 [J] . 马艳荣 ,温煜坤 . 现代电子技术 . 2021,第008期
4. 支持向量机与分类后验概率空间变化向量分析法相结合的冬小麦种植面积测量方法 [J] . 李苓苓 ,潘耀忠 ,张锦水 . 农业工程学报 . 2010,第009期
5. 基于可靠词汇语义约束的词语向量表达修正研究 [J] . LIANG Yongshi ,HUANG Peijie ,HUANG Peisong . 中文信息学报 . 2019,第001期
6. 基于可靠词汇语义约束的词语向量表达修正研究 [C] . LIANG Yongshi ,梁泳诗 ,HUANG Peijie . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于特征向量与核函数相结合的高新技术词汇关系抽取模型研究 [A] . 陈秋瑞 . 2019

向量模型和多源词汇分类体系相结合的词语相似性计算

摘要

著录项

相似文献

相关主题

期刊订阅