Embedding wikipedia title based on its wikipedia text and categories

机译：根据维基百科标题和类别嵌入维基百科标题

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Distributed word representation is widely used in many NLP tasks and knowledge-based resources also provide valuable information. Comparing to conventional knowledge bases, Wikipedia provides semi-structural data other than structural data. We argue that a Wikipedia title's categories can help complement the title's meaning besides Wikipedia text, so the categories should be utilized to improve the title's embedding. We propose two directions of using categories, cooperating with conventional context-based approaches, to generate embeddings of Wikipedia titles. We conduct extensively large scale experiments on the generated title embeddings on Chinese Wikipedia. Experiments on word similarity task and analogical reasoning task show that our approaches significantly outperform conventional context-based approaches.

机译：分布式单词表示已广泛用于许多NLP任务中，基于知识的资源也提供了有价值的信息。与常规知识库相比，维基百科提供了除结构数据以外的半结构数据。我们认为，Wikipedia标题的类别可以帮助补充Wikipedia文本之外的标题含义，因此应利用类别来改善标题的嵌入。我们提出了使用类别的两个方向，并与基于上下文的常规方法配合使用来生成Wikipedia标题的嵌入。我们对中文维基百科上生成的标题嵌入进行了广泛的大规模实验。单词相似性任务和类比推理任务的实验表明，我们的方法明显优于传统的基于上下文的方法。

著录项

来源
《International conference on Asian language processing》|2017年|146-149|共4页
会议地点 Singapore(SG)
作者
Chi-Yen Chen; Wei-Yun Ma;
展开▼
作者单位

Institute of Information Science Academia Sinica Taipei Taiwan;

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Encyclopedias; Electronic publishing; Internet; Task analysis; Cognition; Knowledge based systems;

机译：百科全书电子出版；互联网;任务分析；认识;基于知识的系统;

相似文献

外文文献
中文文献
专利

1. Named Entity Recognition with Word Embeddings and Wikipedia Categories for a Low-Resource Language [J] . Das Arjun, Ganguly Debasis, Garain Utpal ACM transactions on Asian language information processing . 2017,第3期

机译：资源嵌入的单词嵌入和维基百科类别的命名实体识别
2. Algorithms for Recollection of Search Terms Based on the Wikipedia Category Structure [J] . StijnVandamme, FilipDe Turck ScientificWorldJournal . 2014,第3期

机译：基于维基百科类别结构回忆搜索项的算法
3. Knowledge Expansion Support by Related Search Keyword Generation Based on Wikipedia Category and Pointwise Mutual Information [J] . Saori Kawauchi, Tetsuya Toyota, Hajime Nobuhara Journal of Advanced Computatioanl Intelligence and Intelligent Informatics . 2012,第2a90期

机译：基于维基百科类别和逐点互信息的相关搜索关键字生成对知识扩展的支持
4. Embedding wikipedia title based on its wikipedia text and categories [C] . Chi-Yen Chen, Wei-Yun Ma International Conference on Asian Language Processing . 2017

机译：根据其维基百科文本和类别嵌入维基百科标题
5. Measuring named entity similarity through Wikipedia category hierarchies [D] . Ashman, Jared M. 2010

机译：通过Wikipedia类别层次结构测量命名实体的相似性
6. Wikipedia: A Medical Student Educational Project to Edit Wikipedia inPreparation for Practicing Evidence-Based Pain Medicine [O] . Diana Kantarovich, Hanna B Vollbrecht, Sebastian A Cruz, 2020

机译：维基百科：医学学生教育项目用于编辑维基百科练习练习循证止痛药
7. A new graph based text segmentation using Wikipedia for automatic text summarization [O] . Pourvali Mohsen 2012

机译：一种新的基于图的文本分割，使用维基百科进行自动文本汇总
8. Result Diversity and Entity Ranking Experiments: Anchors, Links, Text and Wikipedia [R] . Kaptein, R., Koolen, M., Kamps, J. 2009

机译：结果多样性和实体排名实验：锚点，链接，文本和维基百科

Embedding wikipedia title based on its wikipedia text and categories

摘要

著录项

相似文献

相关主题

期刊订阅