首页> 中文会议>2005第一届中国分类技术与应用研讨会(CSCA) >局部割边权统计量正态分布近似对SETRED算法的影响

局部割边权统计量正态分布近似对SETRED算法的影响

摘要

SETRED是一种结合了数据审计技术的半监督学习算法,它利用局部割边权统计量分布来协助过滤在自我训练中可能被学习器错误标记的无标记样本.对采用精确计算局部割边权统计量分布和采用正态分布近似可能给SETRED算法性能造成的差异进行了研究.结果表明,在样本属性比极低的数据集上,精确计算统计量分布有助于克服不平衡数据集对算法性能的影响.但是,通常情况下使用正态分布与精确计算统计量分布相比,算法性能并无显著差异,这说明在实际算法中使用正态分布近似是可行的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号