首页> 中文学位 >外包数据库模型中文本数据完整性检测方案的研究
【6h】

外包数据库模型中文本数据完整性检测方案的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景

1.2 研究现状

1.3 研究内容

1.4 研究意义

1.5 本文组织结构

第2章 基础知识

2.1 外包数据库模型

2.2 外包数据库模型中的安全机制

2.3 汉语分词

2.4 Karp-Rabin字符串匹配思想

2.5 本章小结

第3章 汉语分词词典设计及分词算法

3.1 引言

3.2 词典设计

3.3 分治策略

3.4 分词算法

3.5 算法流程举例

3.6 歧义消解

3.7 本章小结

第4章 文本数据完整性检测的关键技术

4.1 外包数据库模型中文本数据完整性

4.2 现有文本数据完整性检测的方法

4.3 指纹的抽取

4.4 文本数据的完整性检测方法

4.5 指纹管理方案

4.6 服务器端管理指纹的检测方案

4.7 客户端管理指纹的检测方案

4.8 安全性分析

4.9 本章小结

第5章 实验与性能分析

5.1 引言

5.2 实验环境

5.3 分词技术的性能分析与实验

5.4 完整性检测技术性能分析与实验

5.5 本章小结

结论

参考文献

攻读硕士学位期间承担的科研任务与主要成果

致谢

作者简介

展开▼

摘要

数据库服务外包是近几年兴起的一种新的数据库应用模式。外包数据库模型中数据的完整性检测是为了防止外包数据库提供商内部和外部人员对数据库内容篡改,保证查询者获得正确查询结果的一种手段。现有的完整性检测方法都是针对关系型数据库中的结构化数据,对于文本这种非结构化数据目前还没有成型的解决方案。为了完善外包数据库模型中数据完整性检测技术,提出了一种基于数字指纹的文本数据的完整性检测方案。
  首先,介绍了外包数据库模型的基本工作原理,分析了现有的数据完整性检测技术的优缺点和外包数据库中特有的安全机制,并阐述了中文分词的相关技术和主要问题。
  其次,为了满足提高分词速度的迫切需求,根据汉语成词特点,建立一种新的词典机制,提出了应用分治策略的汉语分词方法,并利用统计技术解决汉语分词中广泛存在的交集型歧义切分问题。
  再次,通过对文本数据的分析,利用Karp-Rabin算法思想,提出了文本数据的数字指纹抽取方法,在该方法基础上,提出了一种基于数字指纹的文本数据的完整性检测方案,该方案不仅可以检测文本数据的完整性,还可以对被篡改数据的位置进行精确定位。然后给出了客户端和服务器端两种指纹管理方案,同时进行了安全性分析,并分别阐述了上面两种情况下秘密文本数据和公开文本数据的完整性检测方案。
  最后,对上述分词方法和文本数据完整性检测算法进行了理论分析,并通过实验对所提方法的正确性和有效性进行了验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号