首页> 外文期刊>電子情報通信学会技術研究報告 >劣モジュラ性を用いた特徴集合列挙
【24h】

劣モジュラ性を用いた特徴集合列挙

机译:使用次模块化的功能集枚举

获取原文
获取原文并翻译 | 示例
           

摘要

Selecting relevant features is a fundamental task in machine learning. Although many approaches have been investigated so far, regularized-learning with sparsity-inducing norms, such as LASSO, would be one of the most promising ones. In this paper, we investigate a challenging problem beyond feature selection — feature-set enumeration, where we try to enumerate all ∈-optimal feature-sets in the l_0-regularized feature selection with sub-modular measures. We develop a novel algorithm for this problem based on the branch-and-bound framework, where bounding and cutting are performed using the structure of binary decision diagrams (BDDs) and the submodularity of selection measures. The performance of the proposed algorithm is investigated through experiments with artificial datasets.%特徴選択は,所与の特徴(パラメータや属性,関数などの集合)の中から問題解決に有効なその一部を取り出すタスクであり,機械学習や統計科学,データマイニングなどにおける最も重要な課題の一つである.この問題は近年,解釈性や計算効率の有用性から,疎な解を誘導しやすいノルムを用いた正則化損失関数最小化の枠組みで議論される場合が多い.損失関数の多くは集合関数として見た場合,劣モジュラ性を有するため,本稿では,特徴選択を劣モジュラ関数最適化として定式化する.これは,最も疎な解を誘導しやすいl_0ノルムを用いた正則化損失関数最小化を直接扱っている事に相当する.著者らは,2分決定図(Binary Decision Diagram;BDD)を用いた解空間の表現,及び,特徴を選択する評価関数の劣モジュラ性を用いた効率的な探索により,厳密解を含む最適性の高い解を列挙する方法を提案する.さらに,提案手法の有用性に関する検証例を示す.
机译:迄今为止,尽管已经研究了许多方法,但是具有稀疏性准则的正则学习(如LASSO)将是最有希望的方法之一。特征选择之外的问题—特征集枚举,我们尝试使用子模量来枚举l_0正规化特征选择中的所有ε-最优特征集,为此,我们针对分支和-约束框架,其中使用二元决策图(BDD)的结构和选择度量的子模数执行边界和切割。通过人工数据集的实验研究了该算法的性能。这是从一部分参数,属性,函数等中提取对解决问题有效的一部分的任务,并且是机器学习,统计科学,数据挖掘等中最重要的任务之一。近年来,由于其可解释性和计算效率的实用性,经常在使用容易引起稀疏解的范数的正则化损失函数最小化框架中讨论此问题。由于许多损失函数在视为集合函数时具有次模量,因此本文将特征选择表述为次模函数优化。这等效于使用倾向于引起最稀疏解的l_0范数直接处理正则化损失函数最小化。作者提出了最优方案,其中包括通过使用二元决策图(BDD)表示解决方案空间来表示精确解决方案,以及使用选择特征的评估函数的子模量进行有效搜索的方法。我们提出了一种枚举高解的方法。此外,给出了有关所提出方法的有效性的验证示例。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号