首页> 中文学位 >基于自然语言处理的文本数字水印技术研究
【6h】

基于自然语言处理的文本数字水印技术研究

代理获取

目录

基于自然语言处理的文本数字水印技术研究

Research on Text Watermarking Based on Natural Language Processing

摘 要

Abstract

第1章 绪 论

1.1 研究背景及意义

1.2 国内外研究现状与分析

1.3 文本数字水印技术分析

1.4 自然语言处理技术

1.5 论文的主要内容

第2章 基于词性标注序列的文本水印算法

2.1 分词技术和词性标注

2.2 零水印技术

2.3 算法的思想与内容

2.4 实验结果及性能分析

2.5 本章小结

第3章 基于语法转化的文本水印技术

3.1 引言

3.2 自然语言语法分析及语法转化技术

3.3 Atallah语法水印算法及分析

3.4 改进的语法水印算法

3.5 基于改进语法水印算法的文本篡改定位方案

3.6 本章小结

第4章 基于文本水印的版权保护方案的研究

4.1 多重水印技术思想

4.2 基于多重文本水印的版权保护

4.3 本章小结

结 论

参考文献

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致 谢

展开▼

摘要

随着网络技术的飞速发展以及信息化进程的迅速推进,数字媒体已成为成为当今社会一种重要信息媒介。互联网的便捷性和数字媒体复制的低成本,在促进数字产品的在现实中应用迅速发展的同时,也带来了一系列挑战。其中,数字信息传播的不可控性使得数字媒体的版权保护问题变得倍受关注,而数字水印技术正是解决这一问题的有效技术手段之一。
  在众多的数字媒体信息中,文本信息的传播和应用都是最广泛的,文本内容更有价值,却更容易复制,所以针对文本数字水印的研究变得更加急迫。目前,针对文本水印大部分的研究是基于文本格式的,最典型的研究是字移、行移和特征编码等,而此类水印算法的鲁棒性较差,且无法在无格式文本中实现水印。本文针对文本信息版权保护的需求,提出了基于词性标注序列的文本水印算法和改进的语法水印算法,能够很好解决基于格式水印出现的问题,鲁棒性、隐蔽性以及容量方面都很具有很好的性能,并且结合这两种文本水印算法的特点,实现适用版权保护的多重水印技术。
  本文首先提出了一种基于词性标注序列的文本水印算法,通过分词和词性标注技术将文本内容映射为词性标注序列,利用Huffman编码,将水印信息的产生和解码转化为文本内容与词性标注序列的关系,该算法是一种零水印算法,改变了传统数字水印必须改变载体内容的工作方式,与传统方法相比具有更好的隐蔽性和更广泛的适应性。
  然后,本文针对M.J. Atallah教授的提出语法水印算法容量较小的问题,通过加入介词短语与分词短语和从句的之间的转化,以及随机组合等方式丰富语法转换方法,引入可嵌入集合和不可嵌入集合,利用语法结构变换将水印信息分段嵌入,进而改进了Atallah教授提出的语法水印算法。本算法最大限度地利用文本中可以进行语法转化的句子,实现语法水印的最大容量嵌入,并具有较强的鲁棒性。实验表明该算法和原有的语法水印算法相比,水印嵌入容量平均提高58.2%,有很大程度的提高。
  在最后,本文基于课题在课题中前面的两种文本水印算法,提出基于多重水印技术的版权保护方案,进而针对MS Word文档实现版权保护系统,这对于网络图书馆和电子出版的应用都有着非常深远的意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号