首页> 外文OA文献 >Classification hiérarchique floue basée sur le SVM et son application pour la catégorisation des documents
【2h】

Classification hiérarchique floue basée sur le SVM et son application pour la catégorisation des documents

机译:基于支持向量机的模糊层次分类及其在文档分类中的应用

摘要

La croissance exponentielle des moyens de communication durant ces dernières années et en particulier l'Internet a contribué à l'augmentation du volume de données traitées via les réseaux informatiques. Cette croissance a poussé les chercheurs à penser à la meilleure façon de structurer ces données pour faciliter leur accès et leur classification. À ce problème de classification, plusieurs techniques ont été proposées. Dans la pratique, nous constatons deux grandes familles de problèmes de classification, les problèmes binaires et les problèmes multi-classes. Le premier constat ayant attiré notre attention est l'existence du problème de confusion de classes lors de la classification. Ce phénomène rend les résultats ambigus et non interprétables. Le deuxième constat est la difficulté de résoudre ces problèmes par les méthodes existantes surtout dans le cas où les données ne sont pas linéairement séparables. En outre, les méthodes existantes souffrent des problèmes de complexité en temps de calcul et d'espace mémoire. Afin de remédier à ces problèmes, nous proposons une nouvelle méthode de classification qui s'articule autour de trois principaux concepts: la classification hiérarchique, la théorie de la logique floue et la machine à vecteur de support (SVM). À cet égard et vu l'importance accordée au domaine de classification des textes, nous adaptons notre méthode pour faire face au problème de la catégorisation des textes. Nous testons la méthode proposée sur des données numériques et des données textuelles respectivement. Les résultats expérimentaux ont démontré une performance considérable comparativement à certaines méthodes de classification.
机译:近年来,特别是因特网,通信手段的指数增长促进了通过计算机网络处理的数据量的增加。这种增长促使研究人员思考构造此数据以促进其访问和分类的最佳方法。已经针对该分类问题提出了几种技术。在实践中,我们发现了两个主要的分类问题系列:二元问题和多类问题。引起我们注意的第一个观察结果是分类过程中存在类混淆问题。这种现象使结果模棱两可,难以解释。第二个观察结果是难以通过现有方法解决这些问题,尤其是在数据不可线性分离的情况下。另外,现有方法存在计算时间和存储空间复杂的问题。为了解决这些问题,我们提出了一种新的分类方法,该方法围绕三个主要概念:层次分类,模糊逻辑理论和支持向量机(SVM)。在这方面,鉴于文本分类领域的重要性,我们正在调整我们的方法来处理文本分类问题。我们分别在数值数据和文本数据上测试了该方法。与某些分类方法相比,实验结果证明了可观的性能。

著录项

  • 作者

    Guernine Taoufik;

  • 作者单位
  • 年度 2010
  • 总页数
  • 原文格式 PDF
  • 正文语种 fre
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号