首页> 中文学位 >基于超球覆盖仿生模式识别的文本分类算法研究
【6h】

基于超球覆盖仿生模式识别的文本分类算法研究

代理获取

目录

摘要

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 文本分类在国内外研究现状

1.2.2 仿生模式识别在国内外研究现状

1.3 本文主要研究内容

1.4 本文的内容组织

第二章 文本分类及其关键技术

2.1 引言

2.2 文本分类的基本概念

2.2.1 文本分类的定义

2.2.2 文本分类的模型

2.3 文本分类的技术和方法

2.3.1 文本预处理

2.3.2 文本表示

2.3.3 文本分类算法

2.4 分类性能评估

2.5 本章小结

第三章 仿生模式识别理论基础及算法实现

3.1 引言

3.2 仿生模式识别(BPR)基本原理

3.3 仿生模式识别的实现——多自由度神经元的几何形体覆盖

3.3.1 双权值神经元模型

3.3.2 多自由度神经元模型的构造算法

3.3.3 基于高维空间几何模板的仿生模式识别算法

3.4 本章小结

第四章 基于仿生模式识别的文本分类算法

4.1 引言

4.2 仿生模式识别用于文本分类的原理

4.3 基于超球覆盖的仿生模式识别算法

4.3.1 高维超椭球的困难

4.3.2 基于超球覆盖的仿生模式识别算法

4.4 超球覆盖仿生模式识别与神经网络仿生模式识别的比较

4.5 实验结果与分析

4.5.1 实验设置

4.5.2 系统框图

4.5.3 实验结果分析

4.6 本章小结

第五章 总结和展望

致谢

参考文献

攻读学位期间的科研成果

声明

展开▼

摘要

2006年Google首席执行官Eric Schmidt首次提出了“云计算”的概念,现在它已成为国际IT业中的重要增长点。云计算时代的到来,使得各种类型的互联网应用层出不穷,各类数据呈爆炸式的增长,对于存储在云数据库中的海量文本数据而言,用户如何快速有效地获取、管理和使用这些文本数据,已经成为信息科学迫切需要解决的问题,其中使用文本分类是有效的文本数据处理方法。
   在文本分类系统中分类器的构造是极其重要的,传统的文本分类算法或传统的模式识别都是基于最佳划分的,而仿生模式识别(Bionic Pattern Recognition,BPR)强调的是对事物的“认识”而非“区分”,更符合人类认识世界的本质。中科院王守觉院士提出了的仿生模式识别的数学实现方法,即通过对特征空间中的样本采用高维空间复杂几何形体进行覆盖,实现模式识别。仿生模式识别在语音识别、人脸识别、地面实物识别方面都得到了很好的识别效果。实践表明仿生模式识别方法有许多优点,能够有效地降低识别的错误率,识别效率优于传统的模式识别方法。
   本文以此为出发点,首先介绍了文本分类的基本概念和关键技术,然后研究了仿生模式识别的理论基础及其神经网络算法实现,又从几何理论的角度提出了本实验室的一种用超椭球作为高维空间同源类模板的仿生模式识别算法。接着又在此基础上,针对文本特征空间的高维性和表示向量的稀疏性提出了一种改进的基于超球覆盖的仿生模式识别新算法。该算法能灵活地覆盖特征空间中的样本点,有效地克服了文本特征的稀疏性。实验结果表明,在中文数据上,基于超球覆盖的仿生模式识别分类算法要比传统的分类算法的分类性能更好,虽然在训练时间上有待提高,但在分类时间上能实现更快的速度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号