【24h】

Tracing State-Level Obesity Prevalence from Sentence Embeddings of Tweets: A Feasibility Study

机译:从推文的句子嵌入追踪状态级肥胖普遍性:可行性研究

获取原文

摘要

Twitter data has been shown broadly applicable for public health surveillance. Previous public heath studies based on Twitter data have largely relied on keyword-matching or topic models for clustering relevant tweets. However, both methods suffer from the short-length of texts and unpredictable noise that naturally occurs in user-generated contexts. In response, we introduce a deep learning approach that uses hashtags as a form of supervision and learns tweet embeddings for extracting informative textual features. In this case study, we address the specific task of estimating state-level obesity from dietary-related textual features. Our approach yields an estimation that strongly correlates the textual features to government data and outperforms the keyword-matching baseline. The results also demonstrate the potential of discovering risk factors using the textual features. This method is general-purpose and can be applied to a wide range of Twitter-based public health studies.
机译:推特数据已被广泛适用于公共卫生监测。 以前的基于Twitter数据的公共Heath研究主要依赖于关键字匹配或主题模型来聚类相关推文。 然而,两种方法都遭受了自然地发生在用户生成的上下文中的短的文本和不可预测的噪声。 作为响应,我们介绍了一种深入的学习方法,它使用Hashtags作为一种监督形式,并学习用于提取信息性文本功能的推文嵌入。 在本案研究中,我们解决了估算与膳食相关文本特征的状态级肥胖的特定任务。 我们的方法产生了一种估计,强烈地将文本特征与政府数据的文本功能强烈关联,并且优于关键字匹配的基线。 结果还展示了使用文本特征发现风险因素的可能性。 这种方法是通用目的,可以应用于广泛的基于Twitter的公共卫生研究。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号