基于自然语言处理的文本数字水印技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络技术的飞速发展以及信息化进程的迅速推进，数字媒体已成为成为当今社会一种重要信息媒介。互联网的便捷性和数字媒体复制的低成本，在促进数字产品的在现实中应用迅速发展的同时，也带来了一系列挑战。其中，数字信息传播的不可控性使得数字媒体的版权保护问题变得倍受关注，而数字水印技术正是解决这一问题的有效技术手段之一。
　　在众多的数字媒体信息中，文本信息的传播和应用都是最广泛的，文本内容更有价值，却更容易复制，所以针对文本数字水印的研究变得更加急迫。目前，针对文本水印大部分的研究是基于文本格式的，最典型的研究是字移、行移和特征编码等，而此类水印算法的鲁棒性较差，且无法在无格式文本中实现水印。本文针对文本信息版权保护的需求，提出了基于词性标注序列的文本水印算法和改进的语法水印算法，能够很好解决基于格式水印出现的问题，鲁棒性、隐蔽性以及容量方面都很具有很好的性能，并且结合这两种文本水印算法的特点，实现适用版权保护的多重水印技术。
　　本文首先提出了一种基于词性标注序列的文本水印算法，通过分词和词性标注技术将文本内容映射为词性标注序列，利用Huffman编码，将水印信息的产生和解码转化为文本内容与词性标注序列的关系，该算法是一种零水印算法，改变了传统数字水印必须改变载体内容的工作方式，与传统方法相比具有更好的隐蔽性和更广泛的适应性。
　　然后，本文针对M.J. Atallah教授的提出语法水印算法容量较小的问题，通过加入介词短语与分词短语和从句的之间的转化，以及随机组合等方式丰富语法转换方法，引入可嵌入集合和不可嵌入集合，利用语法结构变换将水印信息分段嵌入，进而改进了Atallah教授提出的语法水印算法。本算法最大限度地利用文本中可以进行语法转化的句子，实现语法水印的最大容量嵌入，并具有较强的鲁棒性。实验表明该算法和原有的语法水印算法相比，水印嵌入容量平均提高58.2％，有很大程度的提高。
　　在最后，本文基于课题在课题中前面的两种文本水印算法，提出基于多重水印技术的版权保护方案，进而针对MS Word文档实现版权保护系统，这对于网络图书馆和电子出版的应用都有着非常深远的意义。

著录项

作者
邱志龙;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名牛夏牧;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类数据安全;
关键词
文本信息; 版权保护; 数字水印技术; 自然语言处理; 词性标注序列;

相似文献

中文文献
外文文献
专利

1. 基于文本的数字水印技术研究 [J] . 杨金凡 . 科技资讯 . 2007,第016期
2. 基于文本文档的版权保护技术——文本数字水印的研究 [J] . 舒后 ,何薇 ,齐亚莉 . 计算机应用与软件 . 2006,第007期
3. 文本数字水印技术研究综述 [J] . 刘旻昊 ,孙堡垒 ,郭云彪 . 东南大学学报（自然科学版） . 2007,第0z1期
4. 文本数字水印技术研究 [J] . 严智萍 ,朱更明 . 计算机安全 . 2007,第012期
5. 文本数字水印技术研究综述 [J] . 刘曼昊 ,孙堡垒 ,郭云彪 . 东南大学学报：自然科学版 . 2007,第A01期
6. TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索 [C] . 施水才 ,肖诗斌 ,王弘蔚 . 中国中文信息学会二十周年学术会议 . 2001
7. 基于汉明码的文本数字水印技术研究 [A] . 蒋策 . 2015

基于自然语言处理的文本数字水印技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅