首页> 外文期刊>電子情報通信学会技術研究報告 >評価語の相互依存関係を考慮した三つ組抽出
【24h】

評価語の相互依存関係を考慮した三つ組抽出

机译:考虑评价词相互依存的三合会提取

获取原文
获取原文并翻译 | 示例
       

摘要

本研究はblog等のWeb上のテキストから.製品等についての評価表現を対象語,属性語,評価語の三つ組として抽出することを目的としている。この三つ組抽出を,文に対する系列タギング問題の一種として解くことで,一語に限らない多様な表現の抽出を行う.評価表現では対象語とその属性語が評価語と強く関連しているため.対象・属性語と評価語の結びつきの強さを含めて学習を行う枠組みを提案する。このため,本研究では構造学習の枠組みを用いて文に対するラベル系列を学習する.文とラベルに対して素性ベクトルを定義し,文とラベルをモデルで評価したスコアを最大化するように,Viterbiアルゴリズムを元にしたアルゴリズムでラベルを探索する.学習にはオンライン学習アルゴリズムのPassive Aggressive Algorithmを用い,正しいラベル系列が探索空間中でスコアが高くなるよう,モデルを更新することで行う.Web文書に対して評価表現の三つ組がタグ付けされたコーパスを用いて,提案手法の実験を行った結果を元に,手法の問題点とその解決策についての考察を行う.%In this paper, we intend to extract tuples of evaluative expression on targets from web texts. An evaluative tuple contains three types of elements, target, attribute and evaluation. We expand the scope of elements to continuous words instead of a single word to collect more diverse types of expressions. We propose a new method to learn to extract tuples taking into account dependency within expressions, because the target and attribute have a high correlation with evaluation each other. We will discuss an issue and resolution based on the results of experiments on the tagged web texts corpus.
机译:这项研究基于博客等网络文本。目的是提取作为目标词,属性词和评估词的三者的产品等的评估表达式。通过将这种三元组抽取解决为句子的序列标记问题,可以抽取不限于一个单词的各种表达形式。在评估表达式中,目标词及其属性词与评估词密切相关。我们提出了一个学习框架,包括目标/属性词和评估词之间的连接强度。因此,在本研究中,使用结构学习的框架来学习句子的标签序列。为句子和标签定义特征向量,并通过基于维特比算法的算法搜索标签,以使模型为句子和标签所评估的得分最大化。在线学习算法被动学习算法用于学习,并且对模型进行更新,以便正确的标签序列在搜索空间中具有更高的分数。基于所提出的使用语料库的实验结果,该语料库为Web文档标记了三组评估表达式,我们考虑了该方法的问题及其解决方案。 %本文旨在从Web文本中提取目标上的评估表达元组。评估元组包含目标,属性和评估这三种元素,我们将元素的范围扩展到连续单词而不是单个单词来进行收集我们提出了一种新的方法来学习提取考虑到表达式内相关性的元组,这是因为目标和属性之间的相关性很高。我们将根据实验结果讨论问题和解决方案。在标记的Web文本语料库上。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号