首页> 中国专利> 基于排序的抄袭检测文本匹配方法

基于排序的抄袭检测文本匹配方法

摘要

基于排序的抄袭检测文本匹配方法,涉及抄袭检测技术领域。本发明为了实现高模糊抄袭的检测,解决基于启发式方法依赖专家经验、无法融合抄袭检测中各类有效的特征的问题。将抄袭文本的匹配形式化为一个排序任务,给出一个可疑文本片段,该方法应用基于序对的排序学习方法获得源文档中该片段最可能抄袭的片段。本发明引入机器翻译的评价指标METEOR来捕获词汇相似和语义相似。应用PAN2012和PAN 2013的抄袭检测数据集对该方法进行了评价,并与PAN2013、2013和2014评测中获得最好性能的方法进行了比较。在高模糊抄袭和总结抄袭子集上,本发明相对基线方法在评价指标Plagdet上分别提高了22%和43%。本发明方法时间效率也优于基线方法。

著录项

  • 公开/公告号CN108509414B

    专利类型发明专利

  • 公开/公告日2021-09-03

    原文格式PDF

  • 申请/专利权人 黑龙江工程学院;

    申请/专利号CN201810198863.2

  • 发明设计人 孔蕾蕾;韩中元;齐浩亮;

    申请日2018-03-09

  • 分类号G06F40/30(20200101);G06F16/35(20190101);

  • 代理机构23109 哈尔滨市松花江专利商标事务所;

  • 代理人杨立超

  • 地址 150050 黑龙江省哈尔滨市道外区红旗大街999号

  • 入库时间 2022-08-23 12:25:35

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号