首页> 中文学位 >基于单字的中文全文检索数据结构和算法模型分析
【6h】

基于单字的中文全文检索数据结构和算法模型分析

代理获取

目录

文摘

第一章前言

第二章中文全文检索技术综述

第三章中文全文检索技术的比较

3.1.基于分词的全文检索算法

3.1.1.分词检索技术的优点

3.1.2.分词检索技术的缺点

3.2.基于单字的全文检索算法

3.2.1.按字检索技术的优点

3.2.2.按字检索技术的缺点

3.3.中文全文检索算法的比较结论

第四章基于单字的中文全文检索数据结构和算法模型

4.1.模型设计的前提要求说明

4.2.模型算法总体思路

4.2.1.创建/插入索引总体思路

4.2.2.检索算法的总体思路

4.3.模型数据结构描述

4.3.1.外存文件数据结构

4.3.2.内存数据结构

4.3.3.数据结构的程序描述

4.4.算法模型描述

4.4.1.检索策略

4.4.2.创建/插入索引策略

4.4.3.检索算法过程或函数

4.4.4.关于部分算法过程的说明

第五章数据结构和算法模型分析

第六章数据结构和算法模型的改进

6.1.数据结构的改进

6.2.算法的改进

6.3.其它算法模型的理论改进

6.3.1.增加文件的数据结构

6.3.2.修改文件的数据结构

第七章算法检索效率比较

7.1.算法检索效率比较

7.2.算法模型效率的实例比较

7.2.1.方案假设

7.2.2.存储容量比较

7.2.3.检索效率比较

7.3.比较结论

第八章结束语

第九章参考文献

展开▼

摘要

中文全文检索系统是信息产业中发展较快的一个领域.该文就中文全文检索的不同算法模型,特别是基于分词和基于单字的不同全文检索算法进行了分析比较,针对现实应用问题提出了一个不依赖于具体机器和操作系统的中文全文检索数据结构和算法模型.该文还针对该模型提出了一个改进存储空间效率的模型方法,并对改进模型与原模型进行了分析和比较,从而验证了原模型在目前实务应用上的理论价值.

著录项

  • 作者

    郑宏;

  • 作者单位

    首都经济贸易大学;

  • 授予单位 首都经济贸易大学;
  • 学科 产业经济学
  • 授予学位 硕士
  • 导师姓名 杨一平;
  • 年度 2002
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.135.1;
  • 关键词

    中文; 全文检索; 数据结构; 算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号