首页> 外文会议>情報処理学会;情報処理学会全国大会 >ツイートコーパスを用いた意見抽出システムの構築
【24h】

ツイートコーパスを用いた意見抽出システムの構築

机译:使用Tweet语料库构建意见提取系统

获取原文

摘要

近年企業がTwitter をマーケティングに利用する「ソーシャルリスニング」が広く行われている.しかし,膨大なツイート集合から人手で意見を抽出するのは困難であり,また教師あり学習手法を用いた意見抽出システムもTwitter の特性上,アノテーションにおいて教師データが不均衡になり,抽出精度が落ちるという課題がある.先行研究ではこの課題に対し,アンダーサンプリングやオーバーサンプリングなど教師データレベルで対策を行っているが,本研究ではツイート集合に段階的にフィルタリングをかけることによって,不均衡化が緩和されたツイートコーパスを構築する,アノテーションレベルでの対策手法を提案する.
机译:近年来,公司已使用Twitter进行营销。 “听炭火”被广泛实践。但是,数量巨大 很难从进餐集中手动提取意见,并且 使用监督学习方法的Twitter意见提取系统 由于这些特性,教师数据在注释中变得不平衡。 因此,存在提取精度下降的问题。在以前的研究中 针对以下问题的欠采样和过采样 我们正在教师数据级别采取措施,例如 现在,让我们一步一步过滤推文集。 建立不平衡减轻的推文语料库 我们在注释级别提出对策。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号