首页> 中文学位 >信息检索中个性化信息挖掘技术的研究
【6h】

信息检索中个性化信息挖掘技术的研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1引言

1.2国内外研究现状

1.3课题研究意义

1.4论文的研究内容

1.5论文结构

1.6本章小结

第二章基于Agent的信息检索系统

2.1元搜索引擎的基本概念

2.1.1元搜索引擎的组成以及工作原理

2.1.2元搜索引擎的主要技术

2.1.3元搜索引擎的优势与不足

2.2 Agent技术

2.2.1 Agent的定义及特性

2.2.2 Agent的分类

2.2.3 Agent的体系结构

2.2.4 Agent在Internet上的应用

2.3信息检索技术和理论基础

2.3.1信息检索的概念

2.3.2信息检索的过程

2.3.3信息检索的数学模型

2.4本章小结

第三章Web信息挖掘的关键技术

3.1 Web挖掘

3.1.1数据挖掘及其特征

3.1.2 Web挖掘的定义和构成

3.1.3 Web挖掘的分类

3.2文本的预处理

3.2.1文本分词

3.2.2文本的特征表示

3.2.3文本的相似度计算

3.3文本的自动分类

3.3.1文本分类概述

3.3.2几种典型的分类算法

3.4文本的聚类分析

3.4.1聚类的定义

3.4.2常用的文档聚类策略

3.5本章小结

第四章个性化信息挖掘模块的设计与实现

4.1检索系统工作流程及功能模块介绍

4.2 BP-KNN分类器的实现

4.2.1人工神经网络

4.2.2 BP-KNN分类算法设计

4.2.3评价指标及实验结果分析

4.3用户兴趣模型的建立

4.3.1 Web日志分析

4.3.2用户建模

4.3.3基于Web访问矩阵的兴趣特征挖掘

4.3.4个性化过滤的实现

4.4本章小结

第五章总结与展望

5.1论文工作总结

5.2研究展望

致谢

参考文献

读研期间研究成果

展开▼

摘要

随着Internet技术的迅速发展,Web信息日益膨胀,人们不得不花费大量的时间去搜索自己需要的信息。目前大多数的搜索引擎提供的服务还不能令用户满意,如何从大量的网络信息中挖掘出针对不同用户的个性化资源已经成为研究的热点。本文设计并实现了一种智能信息检索系统,并对其中的核心模块个性化信息挖掘模块做了深入研究。 论文首先分析了元搜索引擎的工作原理和体系结构,探讨了Agent技术在信息检索上的应用;之后研究了Web文本挖掘中的关键技术,其中着重分析了文本自动分类技术,提出了一种改进的基于神经网络的文本分类算法,并对该算法做了可行性验证。接着分析了文档向量空间模型,根据网页中标签的权重特性,提出了一种改进的按标签分级加权的算法。此外,针对用户访问兴趣和访问频度的特点,采用文档预处理、用户识别、会话识别等一系列步骤,建立了一种三层动态兴趣模型,利用该模型对检索信息进行过滤,较好的满足了用户个性化查询的需求。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号