首页> 中文期刊> 《成都信息工程学院学报》 >基于奇异值分解的医疗数据信息提取及分类方法

基于奇异值分解的医疗数据信息提取及分类方法

         

摘要

当医疗数据存在缺失和冗余信息的情况下如何提高预测准确率一直是一个极具挑战的问题.为解决这一挑战,大多数预测模型要么直接删除缺失和冗余的实例,要么使用均值或其他方式对缺失数据进行填补.基于加权KNN算法(weightedk-nearest neighbor,WKNN),提出一种改进的医疗数据分类方法,该方法首先利用KNNI(k-nearest neighbor imputation,KNNI)对包含缺失数据的数据集进行预填补,然后采用奇异值分解(singular value decomposition,简称SVD)对填补后完整的数据进行有效信息提取,最后使用修订权重的WKNN算法进行分类预测.实验表明,在对数据进行填补和信息提取后,显著提高了分类准确率.在5个医疗数据集上,相较于传统的KNN算法分类准确率提升10%左右.在8个医疗数据集上均使用随机森林算法、朴素贝叶斯算法和支持向量机算法进行实验对比,算法分类准确率均取得较好效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号