本研究はblog等のWeb上のテキストから.製品等についての評価表現を対象語,属性語,評価語の三つ組として抽出することを目的としている。この三つ組抽出を,文に対する系列タギング問題の一種として解くことで,一語に限らない多様な表現の抽出を行う.評価表現では対象語とその属性語が評価語と強く関連しているため.対象・属性語と評価語の結びつきの強さを含めて学習を行う枠組みを提案する。このため,本研究では構造学習の枠組みを用いて文に対するラベル系列を学習する.文とラベルに対して素性ベクトルを定義し,文とラベルをモデルで評価したスコアを最大化するように,Viterbiアルゴリズムを元にしたアルゴリズムでラベルを探索する.学習にはオンライン学習アルゴリズムのPassive Aggressive Algorithmを用い,正しいラベル系列が探索空間中でスコアが高くなるよう,モデルを更新することで行う.Web文書に対して評価表現の三つ組がタグ付けされたコーパスを用いて,提案手法の実験を行った結果を元に,手法の問題点とその解決策についての考察を行う.%In this paper, we intend to extract tuples of evaluative expression on targets from web texts. An evaluative tuple contains three types of elements, target, attribute and evaluation. We expand the scope of elements to continuous words instead of a single word to collect more diverse types of expressions. We propose a new method to learn to extract tuples taking into account dependency within expressions, because the target and attribute have a high correlation with evaluation each other. We will discuss an issue and resolution based on the results of experiments on the tagged web texts corpus.
展开▼