首页> 中文学位 >文档复制检测Web服务原型的设计与实现
【6h】

文档复制检测Web服务原型的设计与实现

代理获取

摘要

随着网络数字资源的日益丰富和网络环境使人们对存取信息方式的影响,数字文档唾手可得,文档复制变得越来越容易。近年来,学术剽窃现象屡见报端,互联网上日益增多的重复网页降低了检索效率,给用户带来许多不便。文档复制检测技术是为了防止数字文档的非法复制和扩散而提出的,在知识产权保护和信息检索中有着重要应用。它可以防止剽窃事件的发生,提高互联网检索效率,是近年来数据安全领域研究的热点。
   文档复制检测就是判断一篇给定文档是否抄袭、剽窃或者复制于另外一篇或者多篇文档的内容,剽窃不仅仅意味着原封不动地照搬,还包括对原作的移位变换﹑同义词替换以及改变说法重述等方式。
   本文首先介绍文档复制检测技术的发展背景、基本概念、国内外的研究现状、应用领域及科学意义。接着分析现有检测系统的功能和特点,并探讨构建系统所需要的JAVA EE架构体系、STRUTS框架、MVC模式、XML以及SQL Server等相关技术及其特点,提出了建立基于B/S三层架构的文档复制检测Web服务原型系统的构思。
   其次,本文设计并实现了文档复制检测Web服务原型系统的体系结构,该系统包括:用户注册登录模块、文档上传模块、文档复制检测模块、用户与系统交互模块。该系统采用SQL Server 2000作为后台数据库服务器,XML表示文档文件,用TOMCAT 6.0作为Web服务器,使用JAVA语言编写Web服务器有关程序,客户端用网页浏览器即可访问本系统。
   基于上述工作,实现了文档复制检测Web服务原型系统,该系统基于文档关键词抽取文档特征信息,通过特征信息的匹配来检测文档之间的相似程度,为用户提供了在线文档复制检测服务。在此基础上进行了大量的系统测试,测试证明,该原型系统具有较强的可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号