首页> 中文学位 >基于数字指纹的文本抄袭检测算法研究
【6h】

基于数字指纹的文本抄袭检测算法研究

代理获取

目录

声明

第1章 绪论

1.1 文本抄袭检测背景及意义

1.2 国内外研究现状

1.3 研究内容和文章组织结构

第2章 文本抄袭检测概述

2.1 文本抄袭检测概述

2.2 基于数字指纹的文本抄袭检测流程

2.3 本章小结

第3章 基于依存句法的特征提取算法

3.1 问题的提出

3.2 依存句法简介

3.3 基于依存句法的特征提取模型

3.4 本章小结

第4章 基于Winnowing的数字指纹提取算法

4.1 Winnowing算法

4.2 基于Winnowing的数字指纹提取算法

4.3 数字指纹密度分析

4.4 本章小结

第5章 实验结果及分析

5.1 实验准备

5.2 评价指标

5.3 基于句法框架的特征提取算法实验

5.4 基于Winnowing算法的数字指纹提取实验

5.5 本章小结

第6章 总结与展望

6.1 研究工作总结

6.2 工作展望

致谢

参考文献

附录

展开▼

摘要

基于数字指纹的文本抄袭检测算法已经广泛应用于信息检索、网页去重、图书馆资源版权保护、软件著作权保护等领域。数字指纹检测算法具有存储空间小、检测速度快的优势,适用于大规模的文本集抄袭检测系统。本文在论述了数字指纹检测算法的基本原理和主要流程的基础上,重点围绕文本特征提取以及数字指纹提取展开研究工作。
  本文对常见的文本块划分方法进行了研究,在句子粒度划分和词语间依存关系的基础上,对文本特征提取算法作了一定的改进,该算法可解决对依存句法关系考虑不足的缺陷,有效降低了特征数量。此外,为了减少数字指纹密度,降低计算复杂度,本文对数字指纹特征提取算法作了一定改进,该算法基于 Winnowing滑动窗口机制,根据最优决策模型和最优约束条件选取文本的数字指纹。实验表明,所提出的文本特征提取算法能够准确选择文本的特征集,解决了文本特征数量多的问题,检测的准确率也有所提高;改进的数字指纹提取算法在一定程度上减少数字指纹密度,降低了存储空间。

著录项

  • 作者

    赵萌萌;

  • 作者单位

    杭州电子科技大学;

  • 授予单位 杭州电子科技大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 吴国华;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    机器视觉; 图像识别; 指纹检测; 图像处理;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号