基于二分图的查询推荐算法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

当前，互联网已经成为全世界最大的一个知识库，蕴含着海量的信息，人们可以获取的网络信息与日俱增。用户在面对大规模的网络信息时，却往往茫然于如何更快更准确地找到所需要的信息。搜索引擎可以帮助人们从海量数据中获取信息，已经成为用户获取网络信息的最主要甚至必不可少的工具之一。但目前的搜索引擎与用户的交互方式仍然是主要通过用户根据信息需求自主输入查询关键词进行检索，搜索引擎返回查询结果。由于输入的查询词一般较为简短，并且查询词自身存在歧义性和多义性，搜索引擎并不能准确理解用户真实的搜索意图。基于此种背景下，查询推荐技术如今已经被搜索引擎普遍采用，帮助搜索引擎更准确地了解用户真实的查询意图以及帮助用户构造更加完善的查询。
　　本文主要研究了一种基于二分图的查询推荐算法。采用搜狗查询日志作为实验数据集，对该数据集进行分析与预处理之后，抽取31万条用户历史点击数据作为实验用数据。将用户点击URL在搜索引擎返回结果列表中的排序号和用户点击该URL的顺序号考虑到二分图连接边的权重计算公式中，利用TF-IDF思想计算边的权重，得到Query-URL加权二分图。利用用户点击的URL集合构造向量来表示对应的查询，然后使用余弦相似度方法计算任意两个不同查询间的相似度，最后构建一个描述查询问相关度的查询关系网络图。对一个输入查询推荐N个候选查询的过程是:首先在查询关系网络图上找到该输入查询所在节点的邻居节点构成初始候选查询集合H。若集合H中查询的数目不小于N，直接选取前N个与输入查询相关度得分较高的候选查询进行推荐;若集合H中查询的数目小于N，则将和输入查询节点间接连接的h-hop范围内节点也加入集合H中，利用k-means算法对集合H中的查询进行聚类，最后对包含输入查询的簇进行排序，推荐前N个与输入查询相关度得分较高的候选查询。实验结果表明，本文研究的查询推荐算法具有良好的推荐效果和一定的应用价值。

著录项

作者
朱琅;
展开▼
作者单位

安徽大学;

展开▼
授予单位安徽大学;
学科软件工程
授予学位硕士
导师姓名郑诚;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
加权二分图; 查询推荐; 余弦相似度; 查询关系网络; k-means聚类;

相似文献

中文文献
外文文献
专利

1. 基于二分图卷积表示的推荐算法 [J] . 熊旭东 ,杜圣东 ,夏琬钧 . 计算机科学 . 2021,第004期
2. 基于二分图划分联合聚类的协同过滤推荐算法 [J] . 黄乐乐 ,马慧芳 ,李宁 . 计算机工程与科学 . 2019,第011期
3. LBSN中基于聚类的二分图网络推荐算法 [J] . 贺开明 ,王赜 . 科技资讯 . 2019,第034期
4. 基于用户聚类的二分图网络协同推荐算法 [J] . 郑怀宇 . 沈阳工业大学学报 . 2018,第003期
5. 基于二分图网络的总体多样性增强推荐算法 [J] . 张骏 ,丁艳辉 ,金连旭 . 计算机应用研究 . 2018,第006期
6. 基于二分图的MF-TDMA卫星通信载波/时隙位置分配算法设计与仿真 [C] . SHI Jing-zhan ,史经展 ,Li Zong Bao . 第十二届卫星通信学术年会 . 2016
7. 基于二分图推荐算法的电影推荐系统的设计与实现 [A] . 王灿 . 2011

基于二分图的查询推荐算法

目录

摘要

著录项

相似文献

相关主题

期刊订阅