首页> 中文学位 >基于文本挖掘的主题分类专家系统的设计和实现
【6h】

基于文本挖掘的主题分类专家系统的设计和实现

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1文本挖掘研究现状

1.2文本挖掘的研究意义

1.3论文的组织和主要内容

第2章专家系统概述

2.1引言

2.2专家系统的基本结构

2.3设计开发专家系统的基本技术

2.3.1知识表示

2.3.2知识获取

2.3.3推理机设计

2.3.4基于关系数据库技术的专家系统

2.3.5面向对象设计方法

2.3.6三层架构的设计概述

2.4小结

第3章文本挖掘

3.1数据挖掘

3.2文本挖掘

3.3基于文本挖掘的主要分类技术

3.4小结

第4章主题分类专家系统实现方法探讨

4.1文本分词技术

4.1.1文本分词技术概述

4.1.2分词算法的选取

4.1.3逆向最大匹配分词算法

4.2规则匹配问题

4.2.1问题的提出

4.2.2针对中文字符串匹配的算法

4.2.3试验结果

4.3 小结

第5章主题分类专家系统的设计与实现

5.1主题分类专家系统开发平台的选择

5.1.1数据库平台SQL Sever2000概述

5.1.2程序开发平台VB.NET概述

5.2系统结构和模块划分

5.2.1系统结构和流程

5.2.2系统模块划分

5.3系统特色

5.4小结

第6章总结与展望

6.1总结

6.2前景展望

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

文本挖掘是数据挖掘、机器学习、自然语言理解及相关自动文本处理等理论和技术相结合的产物,是信息检索与数据挖掘领域的研究热点与核心技术,它得到了越来越多研究人员的关注。我们承担的清史图像数据库管理系统是国家清史办公室的重点科研项目,其中主题分类专家系统是基于文本挖掘的相关技术构建的。 在该主题分类系统的开发过程中,笔者研究了高效准确的分词方法,更有利于施用的规则模型,精确度更高的规则匹配算法。具体如下: 1.讨论了逆向最大匹配的分词算法,然后针对系统处理对象的特点,提出了一些改进方法。 2.针对清史图像图片名称命名特点,提出了一个新的规则归纳算法。 3.讨论了几种近似字符串匹配算法,指出其不足之处,然后对基于编辑距离的Pair-wise比较算法作了改进,实验结果证明改进后的算法提高了规则匹配的准确率。 笔者在SQL Sever2000平台上用VB.NET开发了该专家系统,一方面利用SQLSever2000等关系数据库强大的信息管理能力增强了系统对知识的存储、管理和运用的能力,另一方面又借助VB.NET优秀的综合开发能力实现了快速开发。该主题分类专家系统通过系统测试,结果比较令人满意。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号