...
首页> 外文期刊>Biomedical Informatics Insights >Using Ensemble Models to Classify the Sentiment Expressed in Suicide Notes:
【24h】

Using Ensemble Models to Classify the Sentiment Expressed in Suicide Notes:

机译:使用集成模型对自杀笔记中表达的情感进行分类:

获取原文
           

摘要

In 2007, suicide was the tenth leading cause of death in the U.S. Given the significance of this problem, suicide was the focus of the 2011 Informatics for Integrating Biology and the Bedside (i2b2) Natural Language Processing (NLP) shared task competition (track two). Specifically, the challenge concentrated on sentiment analysis, predicting the presence or absence of 15 emotions (labels) simultaneously in a collection of suicide notes spanning over 70 years. Our team explored multiple approaches combining regular expression-based rules, statistical text mining (STM), and an approach that applies weights to text while accounting for multiple labels. Our best submission used an ensemble of both rules and STM models to achieve a micro-averaged F1 score of 0.5023, slightly above the mean from the 26 teams that competed (0.4875).
机译:2007年,自杀是美国第十大死亡原因。鉴于此问题的严重性,自杀是2011年整合生物学信息学和床头(i2b2)自然语言处理(NLP)共享任务竞赛的重点(第二部分) )。具体来说,挑战主要集中在情感分析上,在跨越70年的一系列自杀笔记中同时预测是否存在15种情绪(标签)。我们的团队探索了多种方法,这些方法结合了基于正则表达式的规则,统计文本挖掘(STM),以及在考虑多个标签的同时将权重应用于文本的方法。我们的最佳成绩是使用规则和STM模型的综合,以使F1分数平均达到0.5023,略高于26个参赛队的平均值(0.4875)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号