首页> 中文学位 >基于信息融合的Web信息可信度研究
【6h】

基于信息融合的Web信息可信度研究

代理获取

目录

声明

摘要

1 绪论

1.1 论文研究背景与意义

1.1.1 论文研究背景

1.1.2 论文研究意义

1.2 国内外研究现状

1.3 论文的重点和创新点

1.4 论文组织结构安排

2 Web信息可信度相关技术和理论分析

2.1 信息可信度评估理论分析

2.2 搜索引擎基本流程与原理

2.3 基于链接分析的算法

2.3.1 PageRank算法

2.3.2 Hilltop算法

2.3.3 HITS算法

2.3.4 TrustRaak算法

2.4 基于内容分析和链接分析的算法

2.4.1 Topic-sensitive PageRank算法

2.4.2 ARC算法

2.4.3 Average和Sim算法

2.5 本章小结

3 网页内容相关可信度计算算法研究

3.1 网页相关度计算算法

3.1.1 向量空间模型概念

3.1.2 词频位置加权排序算法

3.1.3 基于语义模型方法

3.2 基于内容相关度算法的改进研究

3.2.1 传统的内容相关度算法的缺点

3.2.2 本文采用的内容相关度算法

3.3 主题词提取算法改进

3.3.1 主题词提取方法

3.3.2 TextRank算法

3.3.3 结合位置权重的TextRank算法

3.4 相关度计算

3.4.1 相关度计算公式

3.4.2 算法分析

3.4 本章小结

4 Web信息可信度计算方法

4.1 Web信息可信度指标体系

4.1.1 Web信息可信度指标分析

4.1.2 搜索引擎可信度评估分析

4.1.3 可信度评估指标体系结构

4.2 Web信息可信度评估流程

4.3 可信度计算方法

4.3.1 可信度计算公式

4.3.2 指标权重选取方法

4.4 本章小结

5 可信度评估系统设计与实现

5.1 系统设计

5.1.1 实验环境介绍

5.1.2 系统模块介绍

5.2 实验过程

5.2.1 数据结构设计

5.2.2 主要界面

5.3 实验结果分析

5.4 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

攻读学位期间主要研究成果

致谢

展开▼

摘要

当用户通过在网络上寻找自己需要的信息时,使用最多的工具是搜索引擎。然而作为商业工具,搜索引擎的结果也并没有让用户特别满意。当然用户可以自己逐一筛选找出有用结果。但是如果要进行Web信息融合,直接使用搜索引擎的结果会加大信息融合的工作量,甚至可能导致结果不准确。本文在这样的背景下提出了基于信息融合的Web信息可信度评估。
  通过分析搜索引擎在网页可信度评估方面的不足,再根据Web信息的特点和信息融合的要求,得出影响Web信息可信度最重要的指标网页相关度。本文对网页相关度的计算进行了研究,构建了信息可信度评估指标体系,提出了可信度计算方法。
  本文主要内容如下:
  1.分析现阶段使用较多的计算网页相关度的算法,根据信息融合的特征,提出本文采用的算法词频位置加权排序算法。根据原有算法的缺点,提出改进设想。引入了TextRank模型来提取主题词,并在原有的TextRank模型基础上加入词语本身的位置权重。既引入了词语的语义概念,又考虑了词语所在网页的位置,提高了主题词提取的准确率。计算相关度时,将词语在提取主题词步骤计算出词语的权重引入公式中,还考虑了主题词与查询词的语义相似度。相关度计算考虑了词语间的语义关系、词语的频率和位置,使得计算更准确。
  2.归纳了现有的信息可信度评估指标,通过分析搜索引擎在可信度评估方面的不足,构建了本文采用的信息可信度评估指标体系。从权威性、重要性、相关性三个方面来评估可信度,每个方面选取最相关的指标,提出了计算可信度的公式。通过这个公式计算的可信度是综合考虑了几种最有影响力最客观的指标,使得可信度的值也最接近信息融合的需要。
  3.设计与实施了可信度评估系统来验证上述方法的有效性,并对结果进行了分析。结果表明,本文提出的算法具有一定的有效性和实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号