首页> 美国卫生研究院文献>Biomedical Informatics Insights >Using Ensemble Models to Classify the Sentiment Expressed in Suicide Notes
【2h】

Using Ensemble Models to Classify the Sentiment Expressed in Suicide Notes

机译:使用集成模型对自杀笔记中表达的情感进行分类

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In 2007, suicide was the tenth leading cause of death in the U.S. Given the significance of this problem, suicide was the focus of the 2011 Informatics for Integrating Biology and the Bedside (i2b2) Natural Language Processing (NLP) shared task competition (track two). Specifically, the challenge concentrated on sentiment analysis, predicting the presence or absence of 15 emotions (labels) simultaneously in a collection of suicide notes spanning over 70 years. Our team explored multiple approaches combining regular expression-based rules, statistical text mining (STM), and an approach that applies weights to text while accounting for multiple labels. Our best submission used an ensemble of both rules and STM models to achieve a micro-averaged F1 score of 0.5023, slightly above the mean from the 26 teams that competed (0.4875).
机译:2007年,自杀是美国第十大死亡原因。鉴于此问题的重要性,自杀是2011年整合生物学信息学和床头(i2b2)自然语言处理(NLP)共享任务竞赛的重点(第二条) )。具体来说,挑战主要集中在情感分析上,在跨越70年的一系列自杀笔记中同时预测是否存在15种情绪(标签)。我们的团队探索了多种方法,这些方法结合了基于正则表达式的规则,统计文本挖掘(STM),以及在考虑多个标签的同时将权重应用于文本的方法。我们的最佳成绩是使用规则和STM模型的综合,以使F1分数平均达到0.5023,略高于26个参赛队的平均值(0.4875)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号