首页> 外文期刊>電子情報通信学会技術研究報告 >Twitterからの人間行動属性の自動抽出
【24h】

Twitterからの人間行動属性の自動抽出

机译:从Twitter自动提取人类行为属性

获取原文
获取原文并翻译 | 示例
           

摘要

The goal of this paper is to describe a method to automatically extract all basic attributes namely actor, action, object, time and location which belong to an activity, in each sentence retrieved from Twitter. Previous work had some limitations, such as inability of extracting infrequent activities, high setup cost, inability of extracting all attributes. To resolve these problems, this paper proposes a novel approach that treats the activity extraction as a sequence labeling problem, and automatically makes its own training data. This approach can extract infrequent activities, and has advantages such as domain-independence, scalability, and unnecessary hand-tagged data.%本論文の目的は,twitterから取得した文中に現れる行動の基本属性(行動主,動作,対象,時間,場所)を自動的に抽出することである.しかし,先行研究では,頻度が低い行動を獲得できない.そして,抽出する前に,動詞リストとカテゴリワード(対象を表すワード)を予め準備しておく必要がある.そこで本論文では,条件付確率場(ConditionalRandom Fields)と自己教師あり学習(Self-Supervised Learning)を用いて,行動属性の自動抽出手法を提案する.提案手法では,人手でラベル編集や行動のドメインの定義などの必要がなく,頻度が低い行動も獲得できる.
机译:本文的目的是描述一种从Twitter检索的每个句子中自动提取属于活动的所有基本属性(即演员,动作,对象,时间和位置)的方法,以前的工作有一些局限性,例如无法提取在解决活动中,设置成本较高,无法提取所有属性。为解决这些问题,本文提出了一种新颖的方法,将活动提取视为序列标记问题,并自动生成自己的训练数据。该方法可以提取不频繁的活动,并且具有诸如域独立性,可伸缩性和不必要的手工标记数据等优点。%本文的目的是自动分析出现在从Twitter获得的句子中的动作的基本属性(动作所有者,动作,目标,时间,地点)。然而,在先前的研究中,不可能获得很少的动作,并且有必要在提取之前预先准备动词列表和类别词(代表目标的词)。因此,在本文中,我们提出了一种使用条件随机场和自我监督学习的动作属性自动提取方法。无需定义即可获得不常发生的动作

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号