文摘
英文文摘
图目录
表目录
第1章 绪论
1.1 文本相似度计算概述
1.1.1 相关概念
1.1.2 主要任务
1.1.3 文本相似度计算方法
1.2 分布式信息检索概述
1.2.1 相关概念
1.2.2 主要任务
1.2.3 DIR的一般流程
1.3 研究背景
1.3.1 论文抄袭形式多样,现象严重
1.3.2 信息安全面临严峻挑战
1.3.3 信息资源异构分散
1.3.4 文档相似检测成为近年来研究的热点
1.4 本文的主要内容与组织结构
1.4.1 本文的主要研究内容
1.4.2 研究方法
1.4.3 试验方案
1.4.4 组织结构
1.5 预期的结果和意义
1.5.1 预期的结果
1.5.2 理论意义
1.5.3 现实意义
1.6 本章小结
第2章 基于集合覆盖的DIR资源选择研究
2.1 问题描述
2.2 相关工作
2.3 目前研究中存在的问题
2.4 基于集合覆盖的资源选择算法的描述
2.5 基于集合覆盖的资源选择实验
2.5.1 算法实现
2.5.2 实验分析与结论
2.6 本章小结
第3章 文本相似度计算混合核函数的构造及其DIR应用
3.1 研究现状
3.1.1 核函数的发展历史及其相关概念
3.1.2 核函数的构造研究现状
3.1.3 用于文本计算的核
3.1.4 分布式信息检索结果融合研究现状
3.2 核函数的构造流程和方法
3.2.1 核函数的构造流程
3.2.2 核函数的构造技术
3.2.3 核函数的构造方法
3.3 建立模型
3.3.1 构建改进的潜在语义核
3.3.2 选择复合ANOVA核
3.3.3 构造新的核函数
3.4 算法描述与复杂度分析
3.4.1 算法描述
3.4.2 算法复杂度分析
3.5 实验
3.5.1 实验语料
3.5.2 实验评价指标
3.5.3 实验设计与结果分析
3.6 实验结论
3.7 本章小结
第4章 文本相似度新核函数构造及其在DIR中的应用
4.1 构造的核函数当满足的条件
4.2 新核的构造思想
4.3 构造步骤
4.4 理论证明
4.5 文档的向量表示
4.6 新构造的核函数相似计算
4.7 算法描述与复杂度分析
4.7.1 算法描述
4.7.2 算法复杂度分析
4.8 实验
4.8.1 实验语料
4.8.2 实验评价指标
4.8.3 实验设计与结果分析
4.9 本章小结
第5章 基于偏微分方程的DIR评价方法
5.1 相关概念
5.2 用于DIR评价的偏微分方程模型
5.2.1 模型建立的思路
5.2.2 模型的假设条件
5.2.3 模型的建立
5.2.4 模型的边界条件
5.2.5 PDE模型的解
5.3 实验设计和结果分析
5.3.1 实验设计
5.3.2 实验结果和讨论
5.4 实验结论
5.5 本章小结
第6章 总结与展望
6.1 研究工作总结
6.2 主要创新成果
6.3 展望
参考文献
致谢
在学期间发表的学术论文及其他科研成果
国内外科技查新报告