首页> 中文会议>第二十二届中国数据库学术会议 >模糊聚类的最大树法在文本分类中的应用研究

模糊聚类的最大树法在文本分类中的应用研究

摘要

随着因特网的快速发展,电子文档的数量增长极快,使得文本自动分类对于信息处理的意义变得更加重要,文本自动分类已成为一项重要的研究课题.目前,国内外学者已经提出了多种文本分类方法,如:Bayes、支持向量机、群体智能、神经网络、N-gram等,但仍然有很多问题亟待解决.本文针对文本分类提出了基于最大模糊支撑树的文本分类算法ATCMT,实验结果表明该算法是一种有效的方法.只要文本特征抽取准确、相似性度量科学,并与其语义相结合,那么就可以提高算法ATCMT的准确性.但是文本分类的难点之一是如何正确地提取文本特征,因为在分词中存在少量的语法歧义;难点之二是特征空间的高维性和特征向量的稀疏性.因此,如何消除语法歧义、如何降低特征空间的维数和提高分类的效率和精度,有待于今后进一步深入研究和完善.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号