基于词向量的实体链接方法

齐爱芹; 徐蔚然

首页> 中文期刊>数据采集与处理 >基于词向量的实体链接方法

基于词向量的实体链接方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

实体链接任务主要包括命名实体识别、查询扩展、候选实体选择、特征抽取和排序.本文针对查询词的扩展,提出了一种基于词向量的扩展方法.该方法利用连续词袋(Continuous bag-of-words,CBOW)模型训练语料中词语的词向量,然后将距离查询词近的词作为扩展词.词向量从语料中挖掘出词与词之间的语义相关性是对基于规则的查询扩展方法的补充,以此来召回候选实体.在特征抽取时,把文档之间的潜在狄利克雷分布(Latent Dirichlet allocation,LDA)的主题相似性作为特征之一.在计算文档相似性时,不再以高频词作为向量的维度,而是以基于词向量的相关词作为向量维度,由此得到文档的语义相似性特征.最后利用基于单文档方法的排序学习模型把查询词链接到相应的候选实体.实验结果表明利用该方法能使F1值达到0.71,具有较好的效果.%Entity linking includes entity discovery,query expansion,candidate generation,feature extraction and ranking.Here the query expansion method based on word embedding is proposed.Word embedding of words are trained by continuous bag-of-words (CBOW) model.Then the related words become the expansion words.The related words could make up the expansion based on rule.The related words could recall more and more candidate words simultaneously.In the feature extraction,the topic similarity between texts is extracted as the feature based on latent Dirichlet allocation(LDA).This paper extracts the synonyms based on word embedding as the dimension of text vector.Finally,learning to rank model is used to select the best candidate entity.The result shows that the method can ensure F1 reaching 0.71,and be effective for entity linking.

著录项

来源
《数据采集与处理》|2017年第3期|604-611|共8页
作者
齐爱芹; 徐蔚然;
展开▼
作者单位

北京邮电大学自动化学院,北京,100876;

北京邮电大学自动化学院,北京,100876;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
实体链接; 潜在狄利克雷分布; 词向量; 排序学习;

相似文献

中文文献
外文文献
专利

1. 基于词向量的中文微博实体链接方法 [J] . 毛二松 ,王波 ,唐永旺 . 计算机应用与软件 . 2017,第004期
2. 基于词向量语义分类的微博实体链接方法 [J] . 冯冲 ,石戈 ,郭宇航 . 自动化学报 . 2016,第006期
3. 基于上下文词向量和主题模型的实体消歧方法 [J] . 王瑞 ,李弼程 ,杜文倩 . 中文信息学报 . 2019,第011期
4. 基于图的联合特征实体链接方法 [J] . 周金 ,朱永华 ,张铁男 . 上海大学学报（自然科学版） . 2020,第005期
5. 基于BERT和TextRank关键词提取的实体链接方法 [J] . 詹飞 ,朱艳辉 ,梁文桐 . 湖南工业大学学报 . 2020,第004期
6. 基于多源知识和Ranking SVM的中文微博命名实体链接 [C] . CHEN Wanli ,陈万礼 ,ZAN Hongying . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 实体链接方法研究及信息安全领域实体链接系统实现 [A] . 王猛 . 2018

基于词向量的实体链接方法

摘要

著录项

相似文献

相关主题

期刊订阅