首页> 美国卫生研究院文献>other >Automatic Entity Recognition and Typing from Massive Text Corpora: A Phrase and Network Mining Approach
【2h】

Automatic Entity Recognition and Typing from Massive Text Corpora: A Phrase and Network Mining Approach

机译:大规模文本语料库的自动实体识别和键入:一种短语和网络挖掘方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In today’s computerized and information-based society, we are soaked with vast amounts of text data, ranging from news articles, scientific publications, product reviews, to a wide range of textual information from social media. To unlock the value of these unstructured text data from various domains, it is of great importance to gain an understanding of entities and their relationships.In this tutorial, we introduce data-driven methods to recognize typed entities of interest in massive, domain-specific text corpora. These methods can automatically identify token spans as entity mentions in documents and label their types (e.g., people, product, food) in a scalable way. We demonstrate on real datasets including news articles and tweets how these typed entities aid in knowledge discovery and management.
机译:在当今的计算机化和信息化社会中,我们沉浸在大量文本数据中,从新闻文章,科学出版物,产品评论到社交媒体的各种文本信息。为了释放来自各个领域的这些非结构化文本数据的价值,对实体及其关系的理解非常重要。在本教程中,我们介绍了数据驱动的方法来识别大量特定于领域的感兴趣的类型化实体文本语料库。这些方法可以自动将令牌范围标识为文档中的实体提及,并以可扩展的方式标记其类型(例如,人,产品,食品)。我们在包括新闻报道和推文的真实数据集上进行演示,这些类型化的实体如何帮助知识发现和管理。

著录项

  • 期刊名称 other
  • 作者单位
  • 年(卷),期 -1(2015),-1
  • 年度 -1
  • 页码 2319–2320
  • 总页数 4
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

  • 入库时间 2022-08-21 11:14:55

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号