首页> 外文会议>Systems and Information Engineering Design Symposium >Leveraging Google BERT to Detect and Measure Innovation Discussed in News Articles
【24h】

Leveraging Google BERT to Detect and Measure Innovation Discussed in News Articles

机译:利用Google Bert检测和衡量新闻文章中讨论的创新

获取原文

摘要

In this paper, we leverage non-survey data (i.e., news articles), natural language processing (NLP), and deep learning methods to detect and measure innovation, ultimately enriching innovation surveys. Our dataset is composed of 1.9M news articles published between 2013 and 2018 acquired from Dow Jones Data, News, and Analytics. We use Bidirectional Encoder Representation from Transformers (BERT), a neural network-based technique for NLP pre-training developed by Google. Our methods involve: (i) utilizing Google’s BERT as a binary classifier to identify articles that mention innovation, (ii) developing BERT’s named-entity recognition algorithm to extract company names from these articles, (iii) leveraging BERT’s question and answering capabilities to extract company and product names. As a result, we obtain innovation indicators, i.e., company innovations in the pharmaceutical sector.
机译:在本文中,我们利用非调查数据(即新闻文章),自然语言处理(NLP)和深度学习方法来检测和衡量创新,最终丰富创新调查。 我们的数据集由2013年至2018年之间发布的1.9M新闻文章组成,从Dow Jones数据,新闻和分析中获得。 我们使用来自变压器(BERT)的双向编码器表示,是Google开发的NLP基于NLP预训练的神经网络技术。 我们的方法涉及:(i)利用Google的BERT作为二进制分类器,以识别提及创新的文章,(ii)开发BERT的命名实体识别算法,以从这些文章中提取公司名称,(iii)利用BERT的问题和回答能力提取 公司和产品名称。 因此,我们获得了创新指标,即制药部门的公司创新。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号