首页> 中文学位 >基于大众标注的对等网语义检索系统模型研究
【6h】

基于大众标注的对等网语义检索系统模型研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1选题背景

1.2国内外研究现状

1.2.1国内研究现状

1.2.2国外研究现状

1.2.3国内外研究现状的比较

1.3本文主要工作及组织结构

第二章 对等网环境下的信息检索

2.1对等网的概念与分类

2.1.1对等网的概念

2.1.2对等网的分类

2.2对等网信息检索

2.2.1 P2P信息检索的动机

2.2.2 P2P的信息检索方式

2.3对等网语义检索系统

2.3.1对等网信息检索系统的概念及特征

2.3.2对等网语义检索系统

2.4本章小结

第三章 基于大众标注的对等网语义检索系统模型

3.1大众标注

3.1.1大众标注的提出及其含义

3.1.2大众标注应用于信息检索的优越性

3.2一种基于大众标注的对等网语义检索系统模型

3.2.1社区资源与用户管理机制

3.2.2系统模型及其子模块

3.3本章小结

第四章 基于Porter算法的英文标签聚类方法研究

4.1标签聚类的基本思想

4.2标签聚类的过程

4.3聚类精度的选择

4.4模拟实验

4.4.1实验设计

4.4.2实验过程

4.4.3实验分析

4.5本章小结

第五章 总结与展望

5.1全文总结

5.2下一步的研究工作

致谢

参考文献

作者在读研期间的研究成果

附录A

展开▼

摘要

由于对等网上数据的分布性、无结构化和缺乏面向语义的表达与描述,导致其检索效率低下,检索成本也随着网络信息量的飞速增加而爆炸性增长。大众标注是在Web2.0时代出现的一种新的资源组织方式,它有助于形成网络资源及用户社区,能够降低信息检索的成本,而且大众标注本身带有一定的语义性,将其应用到P2P环境下的语义检索能为分布式信息的语义检索研究带来新的启示。因此,本文主要研究基于大众标注的对等网语义检索系统模型。
   首先,收集整理中国知网、万方数据库关于对等网信息检索的相关文献及对32届ACM SIGIR信息检索大会的论文主题分析,归纳总结了基于大众标注的对等网语义检索系统模型的国内外研究现状,指出对等网语义检索系统模型的研究是近年来国内外信息检索领域研究的热点之一,基于大众标注的对等网语义检索系统研究是一个新的研究方向。
   接着,利用大众标注能够体现用户语义、有助于形成用户及资源社区等特性,研究了在P2P混合模型下,基于大众标注的社区资源和社区用户管理机制,构建了基于大众标注的P2P语义检索系统模型,并详细阐述了系统的各模块功能和检索流程,重点探讨了其中资源搜索模块的两种搜索方法。
   最后,针对统模型的标签处理模块,引入著名的Porter算法(The porterstemming algorithm)对英文标签进行词根提取,在此基础上提出了可以根据用户需要进行精度选择的英文标签聚类算法,并利用标签云进行了模拟实验。实验表明,采用此聚类算法有利于根据用户的需要组织标签并更准确地描述资源。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号