首页> 中文学位 >基于内容与链接分析的重要Blog信息源发现
【6h】

基于内容与链接分析的重要Blog信息源发现

代理获取

目录

基于内容与链接分析的重要Blog信息源发现

DISCOVERING IMPORTANT BLOGGERS BASED ON CONTENT AND LINK ANALYSIS

摘要

Abstract

第1章 绪论

1.1 研究背景及意义

1.2 问题的定义

1.3 国内外相关研究综述

1.4 本文的主要内容及组织

第2章 危害信息过滤

2.1 用户兴趣表示

2.2 文本特征选择

2.3 相似度计算

2.4 本章小结

第3章 重要Blog信息源发现

3.1 Blog信息识别和链接关系抽取

3.2 Blog信息源量化评估

3.3 评价指标

3.4 对作弊链接影响的遏制

3.5 本章小结

第4章 实验及结果

4.1 系统设计与实现

4.2 危害信息过滤的测试与分析

4.3 Blog信息源量化评估的测试与分析

4.4 本章小结

结论

参考文献

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

哈尔滨工业大学硕士学位涉密论文管理

致谢

展开▼

摘要

Blog是一种基于RSS技术的信息交互平台,它是一种作者与读者以日志风格进行交互的中介,是一种崭新的信息传播和交互方式。与传统的网络信息相比,Blog领域链接关系更加丰富,Blog信息源间交互更加频繁,为用户在互联网上发布信息和进行交互提供了方便。
  随着Blog的迅速发展,信息量的膨胀和信息源的无限增加也带来了严重的问题,非法广告和含有不健康内容的危害信息等层出不穷,并通过博客方便快捷的渠道快速传播。另一方面,信息量的膨胀和信息源的无限增加给互联网用户查找自己所关心的信息带来了不便。
  本文的研究目的在于识别Blog领域的危害信息,并发现重要的Blog信息源,为用户查找相关信息提供方便。研究中采用基于内容的方法,运用文本相似度计算的相关技术识别并过滤Blog领域的危害信息,并取得了较好的效果。为了给用户阅读和查找信息提供方便,本文还提出了一种基于链接分析的对Blog信息源进行量化评估的方法,在此基础之上发现重要Blog信息源,既体现了Blog信息的特点,又在一定程度上减小了作弊链接对链接分析结果的影响,能为用户阅读信息提供方便,并可望为Blog信息检索提供一种新的思路。为了证明该评估方法的有效性,本文还提出了Blog信息源重要性的评价指标,对比了233个Blog信息源量化评估方法和评价指标的评分结果,通过相关性分析证明了此方法和评价指标存在高度的一致性。此外,模拟了多种作弊链接的情况,并在此基础上依据新的链接关系重新计算重要性值,对比了作弊链接前后1057个Blog信息源的重要性值,相关性分析的结果显示作弊链接前后的重要性值相关系数均大于0.9,表明作弊链接对本文提出的方法影响较小。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号