首页> 外文会议>Machine learning(ML95) >Automatic Parameter Selection by Minimizing Estimated Error
【24h】

Automatic Parameter Selection by Minimizing Estimated Error

机译:通过最小化估计误差自动选择参数

获取原文
获取原文并翻译 | 示例

摘要

We address the problem of finding the parameter settings that will result in optimal performance of a given learning algorithm using a particular dataset as training data. We describe a "wrapper" method, considering determination of the best parameters as a discrete function optimization problem. The method uses best-first search and cross-validation to wrap around the basic induction algorithm: the search explores the space of parameter values, running the basic algorithm many times on training and holdout sets produced by cross-validation to get an estimate of the expected error of each parameter setting. Thus, the final selected parameter settings are tuned for the specific induction algorithm and dataset being studied. We report experiments with this method on 33 datasets selected from the UCI and StatLog collections using C4.5 as the basic induction algorithm. At a 90precent confidence level, our method improves the performance of C4.5 on nine domains, degrades performance on one, and is statistically indistin-guishable from C4.5 on the rest. On the sample of datasets used for comparison, our method yields an average 13precent relative decrease in error rate. We expect to see similar performance improvements when using our method with other machine learning algorithms.
机译:我们解决了寻找参数设置的问题,该参数设置将导致使用特定数据集作为训练数据的给定学习算法的最佳性能。我们描述了一种“包装器”方法,考虑了确定最佳参数作为离散函数优化问题。该方法使用最佳优先搜索和交叉验证来包装基本归纳算法:搜索探索参数值的空间,对交叉验证产生的训练和保持集多次运行基本算法,以获取对参数的估计。每个参数设置的预期误差。因此,针对特定的归纳算法和正在研究的数据集调整最终选择的参数设置。我们报告了使用C4.5作为基本归纳算法从UCI和StatLog集合中选择的33个数据集上使用此方法进行的实验。在90%的置信度水平上,我们的方法提高了9个域上C4.5的性能,降低了一个域上的性能,在统计上与其余域的C4.5难以区分。在用于比较的数据集样本上,我们的方法产生了平均13%的错误率相对降低。当将我们的方法与其他机器学习算法一起使用时,我们期望看到类似的性能改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号