首页> 外文学位 >Classification hierarchique floue basee sur le SVM et son application pour la categorisation des documents.
【24h】

Classification hierarchique floue basee sur le SVM et son application pour la categorisation des documents.

机译:基于支持向量机的模糊层次分类及其在文档分类中的应用。

获取原文
获取原文并翻译 | 示例

摘要

La croissance exponentielle des moyens de communication durant ces dernieres annees et en particulier l' Internet a contribue a l'augmentation du volume de donnees traitees via les reseaux informatiques. Cette croissance a pousse les chercheurs a penser a la meilleure facon de structurer ces donnees pour faciliter leur acces et leur classification. A ce probleme de classification, plusieurs techniques ont ete proposees. Dans la pratique, nous constatons deux grandes familles de problemes de classification, les problemes binaires et les problemes multi-classes. Le premier constat ayant attire notre attention est l'existence du probleme de confusion de classes lors de la classification. Ce phenomene rend les resultats ambigus et non interpretables. Le deuxieme constat est la difficulte de resoudre ces problemes par les methodes existantes surtout dans le cas ou les donnees ne sont pas lineairement separables. En outre, les methodes existantes souffrent des problemes de complexite en temps de calcul et d'espace memoire. Afin de remedier a ces problemes, nous proposons une nouvelle methode de classification qui s'articule autour de trois principaux concepts: la classification hierarchique, la theorie de la logique floue et la machine a vecteur de support (SVM). A cet egard et vu l'importance accordee au domaine de classification des textes, nous adaptons notre methode pour faire face au probleme de la categorisation des textes. Nous testons la methode proposee sur des donnees numeriques et des donnees textuelles respectivement. Les resultats experimentaux ont demontre une performance considerable comparativement a certaines methodes de classification.
机译:近年来,尤其是互联网,通信手段呈指数级增长,促进了通过计算机网络处理的数据量的增长。这种增长促使研究人员思考构造这些数据以促进其访问和分类的最佳方法。对于该分类问题,已经提出了几种技术。在实践中,我们发现了两个主要的分类问题系列:二元问题和多类问题。引起我们注意的第一个观察结果是分类过程中存在类混淆问题。这种现象使结果模棱两可,难以解释。第二个观察结果是难以通过现有方法解决这些问题,尤其是在数据不可线性分离的情况下。另外,现有方法存在计算时间和存储空间复杂的问题。为了解决这些问题,我们提出了一种新的分类方法,该方法围绕三个主要概念:层次分类,模糊逻辑理论和带支持向量机(SVM)。在这方面,考虑到文本分类领域的重要性,我们正在调整我们的方法来处理文本分类问题。我们分别在数值数据和文本数据上测试了该方法。与某些分类方法相比,实验结果已显示出可观的性能。

著录项

  • 作者

    Guernine, Taoufik.;

  • 作者单位

    Universite de Sherbrooke (Canada).;

  • 授予单位 Universite de Sherbrooke (Canada).;
  • 学科 Computer Science.
  • 学位 M.Sc.
  • 年度 2010
  • 页码 110 p.
  • 总页数 110
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号