首页> 外文期刊>電子情報通信学会技術研究報告 >複数の分類器に基づく半教師あリ学習を用いた文献からの蛋白質間相互作用抽出
【24h】

複数の分類器に基づく半教師あリ学習を用いた文献からの蛋白質間相互作用抽出

机译:使用基于多个分类器的半监督学习从文献中提取蛋白质-蛋白质相互作用

获取原文
获取原文并翻译 | 示例
           

摘要

文献からのタンパク質相互作用情報抽出において,十分な量の訓練データが得られない場合,仮ラベル推定に基づく半教師あり学習が有効である.このようなタイプの半教師あり学習では仮ラベルを与える際に,誤ってラベルを付与することが精度低下の原因となるため,いかに正確に仮ラベルを付与するかが,極めて重要である.そこで本研究では、複数の分類器を用い,その共通コンセンサスを得る際に,分類器の類似度や学習手法の信頼度を導入することで正確な仮ラベル決定が可能となる手法を提案する。相互作用情報抽出実験の結果として,データセットが比較的大きな場合に,提案手法を用いることで,より精度の高い抽出が達成された.また従来手法との比較において,F値と再現率では同等,もしくは少し劣る結果となったが,適合率の観点では提案手法が優位な結果を示すことが確認された.%Semi-supervised learning based on tentative label prediction is a useful technique for automatic extraction of protein-protein interaction from litratures if enough training instances cannot be prepared. In such a framework of semi-supervised learning, how we predict the correct labels is very important for accurate extraction. In this paper, we propose a method of predicting tentative labels based on multiple classifiers introducing two types of measures for evaluating each classifier, similarity among the classifiers and reliability of the classifiers. As a result of experiment, the proposed method shows higher precision values for relatively large dataset, in comparison with conventional methods.
机译:当从文献中提取蛋白质相互作用信息时,如果没有获得足够数量的训练数据,则基于临时标签估计的半监督学习将非常有效。在这种情况下,准确分配临时标签非常重要,因为不正确的标签会导致准确性降低。我们提出了一种通过引入分类器的相似性和学习方法的可靠性来实现准确的临时标签决策的方法。作为交互信息提取实验的结果,当数据集相对较大时,使用该方法可以实现更准确的提取.F值和召回率与常规方法相比具有可比性。 %或基于临时标签预测的半监督学习是一种用于自动提取蛋白质的有用技术,该方法已被证实在准确性方面具有优势。如果无法准备足够的训练实例,则来自文献的交互作用。在这种半监督学习的框架中,如何预测正确的标签对于准确提取十分重要。本文提出了一种基于多个分类器的预测性标签预测方法。引入了两种评估每个分类器的方法,分类器之间的相似性和分类器的可靠性。作为实验结果,与传统方法相比,该方法在相对较大的数据集上显示出更高的精度值。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号