首页> 中国专利> 一种基于藏文句子级别的藏文论文复制检测方法及系统

一种基于藏文句子级别的藏文论文复制检测方法及系统

摘要

本发明是一种基于藏文句子级别的藏文论文复制检测方法及系统,方法对藏文文本字符编码转换及噪音去除的预处理;利用藏文句子边界识别把文本按句子分成文本块并建立文本块分词临时表;根据句子数在句子‑文档倒排索引表和临时表中提取并计算文本特征得到句子相似度;利用句子相似值建立邻接表并计算文本块相似度,根据文本块相似值来检测两篇藏文论文存在的复制。所述系统包括通过因特网连接到客户终端服务器的藏文论文复制检测装置,以及连接到所述服务器存储藏文论文的数据库;所述装置包括对文本字符编码转换及去除噪音的预处理模块;构建文本块分词的临时表模块;构建句子文本特征的提取模块;检测论文存在相似复制数据的复制检测模块。

著录项

  • 公开/公告号CN106227897A

    专利类型发明专利

  • 公开/公告日2016-12-14

    原文格式PDF

  • 申请/专利权人 青海民族大学;

    申请/专利号CN201610778300.1

  • 申请日2016-08-31

  • 分类号G06F17/30(20060101);G06F17/27(20060101);G06F17/22(20060101);

  • 代理机构北京酷爱智慧知识产权代理有限公司;

  • 代理人赵永辉

  • 地址 810007 青海省西宁市城东区八一中路3号

  • 入库时间 2023-06-19 01:08:44

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-01-11

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160831

    实质审查的生效

  • 2016-12-14

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号