首页> 中国专利> 抄袭源检索排序模型构建方法和抄袭源检索排序方法

抄袭源检索排序模型构建方法和抄袭源检索排序方法

摘要

本发明提供了一种抄袭源检索排序模型构建方法和抄袭源检索排序方法。抄袭源检索排序模型构建方法基于参考文档的每个抄袭源文档与该参考文档之间的聚合度,利用训练样本、通过基于序对的排序学习方式对预定排序逻辑回归模型进行训练,直至预定损失函数的值最小,预定损失函数包括第一和第二子损失函数,第一子损失函数表示基于参考文档的抄袭源文档和非抄袭源文档构成的序对的排序错误带来的损失,而第二子损失函数表示由具有不同的聚合度的抄袭源文档构成的序对的排序错误带来的损失。抄袭源检索排序方法利用上述获得的排序模型对可疑文档的检索结果进行重排序。本发明的上述技术能够在抄袭检测中对可疑文档的源检索结果进行更准确地排序。

著录项

  • 公开/公告号CN108829791A

    专利类型发明专利

  • 公开/公告日2018-11-16

    原文格式PDF

  • 申请/专利权人 黑龙江工程学院;

    申请/专利号CN201810557843.X

  • 发明设计人 孔蕾蕾;韩中元;齐浩亮;

    申请日2018-06-01

  • 分类号

  • 代理机构哈尔滨市阳光惠远知识产权代理有限公司;

  • 代理人刘景祥

  • 地址 150050 黑龙江省哈尔滨市道外区红旗大街999号

  • 入库时间 2023-06-19 07:15:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-12-11

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20180601

    实质审查的生效

  • 2018-11-16

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号