首页> 中文期刊>计算机技术与发展 >基于两阶段特征选择的医疗敏感文本分类

基于两阶段特征选择的医疗敏感文本分类

     

摘要

为完成对医疗数据的敏感性分类,采用文本分类技术从对医疗敏感数据的分类的角度对医疗信息隐私保护进行了研究.在传统的医疗文本分类基础上,提出基于LSI-TF-IDF两阶段特征选择的文本分类方法对医疗文本数据进行敏感性分类.分别采用基于TF-IDF的传统文本分类方法和基于LSI-TF-IDF的两阶段特征选择的文本分类方法对糖尿病文本数据进行敏感性分类,利用朴素贝叶斯、KNN、SVM三个分类器进行实验比较,采用准确率、召回率和F1值作为评价标准.实验结果表明,基于LSI-TF-IDF两阶段特征选择的文本分类方法较之基于TF-IDF的传统文本分类方法在准确率、召回率和F1值上均有所提升.证明了该方法在医疗文本数据的敏感性分类上具有更好的分类效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号