首页> 中文学位 >模式分类中数据选择方法的研究
【6h】

模式分类中数据选择方法的研究

代理获取

目录

文摘

英文文摘

1 绪论

1.1 课题研究背景和意义

1.2 国内外研究现状

1.2.1 模式识别中数据选择方法的研究历史与现状

1.2.2 经典数据选择方法的回顾与评价

1.3 本文的主要研究内容

2 预备知识

2.1 模式识别

2.1.1 模式识别系统

2.1.2 有监督和无监督分类

2.1.3 K均值聚类

2.1.4 K近邻分类器

2.2 模糊数学知识

2.2.1 模糊集合与隶属函数

2.2.2 模糊K近邻分类器

2.3 数据选择方法

2.3.1 不理想数据的概念

2.3.2 数据的剪辑近邻法

2.3.3 数据的压缩近邻法

2.4 本章小结

3 改进的过滤样本方法

3.1 用特征分量来过滤样本

3.1.1 特征分量的处理

3.1.2 加权的特征属性

3.1.3 实验结果

3.2 改进的剪辑K近邻分类器

3.2.1 改进的剪辑近邻法

3.2.2 比较实验

3.3 本章小结

4 基于K均值聚类的数据选择

4.1 过滤样本的背景

4.2 用交集找出稳定的数据

4.3 样本选择后的模糊K近邻分类器

4.3.1 训练集的初始隶属度

4.3.2 基于修正的训练集的模糊K近邻分类器

4.4 实验

4.4.1 实验数据

4.4.2 实验结果和分析

4.5 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

在模式识别中,数据选择越来越重要,对识别的效果起着很关键的作用,尤其是边界数据、冗余数据、杂质数据对分类效果的影响,它大大降低了样本识别率,成为实际问题中亟待解决的难题。本文针对边界数据、冗余数据、杂质数据三种数据,对两种已有的方法进行了拓展,并给出了一种新的数据选择的方法,主要研究成果可归纳如下:
   1.K近邻法通常是按照样本之间的距离来选择K个近邻,本文用特征分量来选择K个近邻,该方法的优点是按照分量来找K个近邻,而不是用整体样本来找K个近邻,避免了样本中某一分量的负面影响。
   2.在剪辑近邻法中通常涉及到两个集合:测试集和参考集,本文通过相互变换两个集合对剪辑近邻法进行了拓展,改进了原来的剪辑近邻法,在很大程度上提高了样本识别率。
   3.为了去除冗余的数据,保留稳定的或者可靠的数据,我们提出了一种新的方法来完成样本选择的过程。其主要思想是用K均值聚类方法先将样本分成C类,然后在比较新旧两类样本集,并取出它们的各自公共元素(样本)作为更新的样本集。此时,更新的样本就是比较稳定的样本。另外为了表示不同样本在每一类中的重要性,我们在更新的样本中给出一种新的模糊关系。
   文章的最后,作者总结全文,指出了有待于迸一步解决的问题,并对数据选择的前景作出了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号