首页> 中国专利> 一种基于本体的电子商务推荐方法

一种基于本体的电子商务推荐方法

摘要

本发明公开了一种基于本体的电子商务推荐方法,属于知识库等领域,用于解决系统难于准确向用户推荐正确结果的问题。本发明获取知识,构建本体知识库;获取用户输入的关键词,对关键词进行处理;利用关键词在本体知识库中查询出相关联的待推荐对像;基于用户-项评分矩阵使用传统关联推荐算法,计算待推荐对象之间的相似度;基于本体知识库计算待推荐对象之间的相似度;基于本体知识库计算的待推荐对象之间的相似度对基于传统关联推荐算法计算的待推荐对象之间的相似度结果进行修正;根据修正结果选出待推荐对象的邻居集并生成推荐列表。本发明用于计算不同本体在本体库中相似度,并使用该相似度对基于协同过滤计算的相似度进行修正。

著录项

  • 公开/公告号CN105023178A

    专利类型发明专利

  • 公开/公告日2015-11-04

    原文格式PDF

  • 申请/专利权人 电子科技大学;

    申请/专利号CN201510493439.7

  • 申请日2015-08-12

  • 分类号G06Q30/02(20120101);G06F17/30(20060101);

  • 代理机构成都弘毅天承知识产权代理有限公司;

  • 代理人杨保刚;徐金琼

  • 地址 611731 四川省成都市高新区西源大道2006号

  • 入库时间 2023-12-18 11:38:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-03

    授权

    授权

  • 2015-12-02

    实质审查的生效 IPC(主分类):G06Q30/02 申请日:20150812

    实质审查的生效

  • 2015-11-04

    公开

    公开

说明书

技术领域

一种基于本体的电子商务推荐方法,用于计算不同本体在本体库中相似度, 并使用该相似度对基于协同过滤计算的相似度进行修正,属于关联推荐,知识库, 数据挖掘等领域。

背景技术

近年来,随着互联网技术的不断发展,越来越多的电子商务如雨后春笋般蓬 勃发展,为社会提供了巨大的效益。然后在这个信息爆炸的时代,每天将会产生 大量的商品信息与用户信息。面对这些信息,电商企业如何能够有效的加以利用, 从而能够挖掘潜在客户,发现用户的兴趣从而能够做到针对不同的用户进行个性 化服务成为一个难点。另一方面,对于用户来说,大量的信息充斥在设备屏幕上, 导致用户查找自己真正需要的信息变的十分困难。特别对于非专业人士来说,当 用户输入的关键词不够准确的时候,系统通常无法提供准确的搜索结果,导致用 户体验大大降低,搜索效率不高的问题。与此同时,当用户无法确定自己需要的 东西是什么,当用户不知道该怎么描述自己需要的东西,或者当用户需要系统能 够有一定推荐功能的时候,传统的搜索引擎系统往往很难满足用户的这些需求。 使得用户在实际搜索的过程中陷入困难,甚至根本无法找到自己需要的东西。

面对上面提到的这些,在用户实际使用过程中会遇到的问题。在电子商务领 域,为了能够提高用户的整体体验,帮助用户找到自己需要的东西,提高商家的 销售量,为商家找到合适的用户,通常使用推荐系统来弥补现有搜索引擎系统的 不足。以往的推荐系统通常通过收集用户行为,例如用户对项的评分,依据评分 记录计算用户或者项之间的相似度,最后通过相似度对用户进行相关推荐。然后 在实际使用过程中,一些问题慢慢的凸显出来,例如项的数量特别大,而用户评 分记录比较少的情况下,将会导致系统难于计算用户或者项之间的相似度,而相 似度计算不准确将直接导致推荐结果的不准确,使得推荐系统的推荐效果往往不 是特别理想。在新的挑战面前,迫切的需要一些科学、高效的方法对相似度在数 据量比较小,用户评分矩阵相对稀疏的情况下,计算不准确问题的解决方法,从 而使得研制和完善这样一个系统的课题成为了国内外学者及工程技术专家的研 究热点。

发明内容

本发明针对现有推荐技术的不足提供了一种基于本体的电子商务推荐方法, 用于解决在用户数据采集量小的情况下,造成系统无法准确计算用户或者待推荐 对象之间的相似度从而导致系统难于准确向用户推荐正确结果的问题。

为实现上述目的,本发明采用的技术方案为:

一种基于本体的电子商务推荐方法,其特征在于,如下步骤:

(1)分析所需业务所涉及到的领域的各项知识,再根据分析的结果有针对 性的去获取知识,对知识进行提取,利用提取的知识,使用传统本体库构建方法 构建本体知识库;

(2)获取用户输入的关键词,使用传统分词算法对用户输入的关键词进行 分词处理,并将停用词去除;

(3)将已进行分词和去除停用词的关键词,在本体知识库中查询出相关联 的待推荐对像;

(4)根据关键词得到待推荐对象后,获取用户对待推荐对象的评分数据;

(5)根据用户对待推荐对象的评分数据,利用传统关联推荐算法计算产生 的用户-项评分矩阵,基于用户-项评分矩阵使用传统关联推荐算法,计算待推荐 对象之间的相似度;

(6)使用传统本体库构建方法构建本体知识库后,基于本体知识库计算待 推荐对象之间的相似度;

(7)使用步骤(6)中基于本体知识库计算的待推荐对象之间的相似度对步 骤(5)中基于传统关联推荐算法计算的待推荐对象之间的相似度结果进行修正;

(8)根据修正结果选出待推荐对象的邻居集并生成推荐列表。

进一步,所述步骤(5)中,基于用户-项评分矩阵使用传统关联推荐算法, 计算待推荐对象之间的相似度的公式为:

S(x,y)=ΣuinUx,y(Pux-Px)×(Puy-Py)ΣuinUx,y(Pux-Px)2×ΣuinUx,y(Puy-Py)2,

其中Pux为用户u对待推荐对象x的评分,Puy为用户u对待推荐对象y的评 分,为用户对待推荐对象x评分的均值,为用户对待推荐对象y评分的均值, u in Ux,y为对待推荐对象x与待推荐对象y进行过评分的用户u。

进一步,所述步骤(6)中,基于本体知识库计算待推荐对象之间的相似度 的具体步骤为:

(61)计算两两本体之间的最短路径,即计算两两待推荐对象之间的最短路 径;

(62)统计推荐过程中,所涉及到的待推荐对象之间,最短路径上的权值;

(63)统计两两待推荐对象到根节点间的路径中,去除重叠部分后剩下路径 包含的节点数的差;

(64)根据步骤(61)、步骤(62)和步骤(63)得到的结果,计算两两待 推荐对象之间的相似度。

进一步,所述步骤(64)中,计算两两待推荐对象之间的相似度的公式为:

So(x,y)=1-1lr(x,y)×ld(x,y)×1α(x,y),

其中,x,y代表在本体知识库中两个不同的待推荐对象,lr(x,y)表示x,y 点到根节点间的路径中,去除重叠部分后,两条路径中包含的节点数的差, ld(x,y)表示x,y点之间的最短路径,α(x,y)表示x,y最短路径上的权值。

进一步,所述步骤(7)中,基于本体知识库计算的待推荐对象之间的相似 度对基于传统关联推荐算法计算的待推荐对象之间的相似度结果进行修正的公 式为:

Sim(x,y)=α×S(x,y)+β×So(x,y),

其中,x,y分别表示两个待计算相似度的待推荐对象,S(x,y)表示基于传 统关联推荐算法得到的两个待推荐对象的相似度,So(x,y)表示基于本体知识库 计算的相似度,α和β为基于传统推荐算法计算的相似度与基于本体的相似度的 不同权值,该权值可以根据项目实际情况进行适当调整。

与现有技术相比,本发明在优点在于:

一、使用基于本体库的方法计算待推荐对象之间的相似程度,其中主要考虑 的因素为:两个待推荐对象在本体库中最短路径的距离;两个待推荐对象到根节 点的路径中,去除重叠部分后剩下路径中,所包含的节点数的差;对本体库中的 每条路径,根据知识背景加入的权值,等3个方面,使用该方法计算的相似度结 果更加准确,并且更能客观的反映待推荐对象之间的相似度;

二、使用基于本体知识库计算出来的相似度对传统关联推荐算法计算出来的 相似度进行修正,很好的解决了传统相似度计算方法中,在待推荐对象的数目太 大而用户数据相对比较稀疏的情况下,计算出来的相似度不准确从而导致整体推 荐结果的不准确情况;

三、使用该方法进行推荐可以较容易的对推荐结果进行解释,不会出现当用 户需要推荐缘由的时候无法给出的情况。

附图说明

图1为本发明的流程示意图;

图2为本发明的框架示意图;

图3为本发明的本体库示意图。

具体实施方式

下面将结合附图及具体实施方式对本发明作进一步的描述。

如图1所示,首先搜集用户输入的关键词,使用传统分词算法对用户输入的 关键词进行分词及去除与推荐不相关的字词。在得到一个关键词向量之后,使用 传统协同过滤推荐方法计算待推荐对象之间的相似度,之后通过本体库计算不同 待推荐对象之间的相似度,并根据调整公式,使用基于本体知识库计算的相似度 对基于传统协同过滤推荐方法计算得到的相似度进行调整。最后基于调整后的相 似度产生推荐结果推荐给用户。基于上述的方法流程得到如图2和图3所示的示 意图。具体如下:

一种基于本体的电子商务推荐方法,步骤如下:

(1)分析所需业务所涉及到的领域的各项知识,即根据所提供的业务找到 业务的特性(如:业务为手机,对应手机的各项知识可为品牌、价格、颜色等属 性或手机适用的年龄层等),再根据分析的结果有针对性的去获取知识,对知识 进行提取,利用提取的知识,使用传统本体库构建方法构建本体知识库,构建的 本体知识库中包含有多个待推荐对象;

(2)获取用户输入的关键词,并根据传统分词算法进行分词处理,并将停 用词去除;

(3)将已进行分词和去除停用词的关键词,在本体知识库中查询出相关联 的待推荐对像,此处的查询方法通过现有的查询方法进行查询;

(4)根据关键词得到待推荐对象后,获取用户对待推荐对象的评分数据(即 用户对待推荐对象的评分或者参与的调查问卷种种形式获取的,并存到数据库里 面的评分数据);

(5)根据用户对待推荐对象的评分数据,利用传统关联推荐算法(例如: 基于项的协同过滤推荐算法)计算产生的用户-项评分矩阵,基于用户-项评分矩 阵使用传统关联推荐算法(例如:基于项的协同过滤推荐算法),计算待推荐对 象之间的相似度;基于用户-项评分矩阵使用传统关联推荐算法,计算待推荐对 象之间的相似度的公式为:

S(x,y)=ΣuinUx,y(Pux-Px)×(Puy-Py)ΣuinUx,y(Pux-Px)2×ΣuinUx,y(Puy-Py)2,

其中Pux为用户u对待推荐对象x的评分,Puy为用户u对待推荐对象y的评 分,为用户对待推荐对象x评分的均值,为用户对待推荐对象y评分的均值, u in Ux,y为对待推荐对象x与待推荐对象y进行过评分的用户u。

(6)使用传统本体库构建方法构建本体知识库后,基于本体知识库计算待 推荐对象之间的相似度;基于本体知识库计算待推荐对象之间的相似度的具体步 骤为:

(61)计算两两本体之间的最短路径,即计算两两待推荐对象之间的最短路 径;如图3所示,产品3与产品2在本体知识库中的距离可以定义为2,而产品 3与产品4之间的距离可以定义为3,所以产品3与产品2之间具有较高的相似 度;

(62)统计推荐过程中,所涉及到的待推荐对象之间,最短路径上的权值; 例如“类型”这个属性对于产品3来说的权值为0.7;

(63)统计两两待推荐对象到根节点间的路径中,去除重叠部分后剩下路径 包含的节点数的差;例如产品3与产品2之间,去除公共路径之后,剩下的节点 数都为1,差为0,而产品3与产品4之间,去除公共路径之后,剩下的节点数 为1和2,差为1,所以产品3与产品2之间具有较高的相似度;

(64)根据步骤(61)、步骤(62)和步骤(63)得到的结果,计算两两待 推荐对象之间的相似度。计算两两待推荐对象之间的相似度的公式为:

So(x,y)=1-1lr(x,y)×ld(x,y)×1α(x,y),

其中,x,y代表在本体知识库中两个不同的待推荐对象,lr(x,y)表示x,y 点到根节点间的路径中,去除重叠部分后,两条路径中包含的节点数的差, ld(x,y)表示x,y点之间的最短路径,α(x,y)表示x,y最短路径上的权值。

(7)使用步骤(6)中基于本体知识库计算的待推荐对象之间的相似度对步 骤(5)中基于传统关联推荐算法计算的待推荐对象之间的相似度结果进行修正; 基于本体知识库计算的待推荐对象之间的相似度对基于传统关联推荐算法计算 的待推荐对象之间的相似度结果进行修正的公式为:

Sim(x,y)=α×S(x,y)+β×So(x,y),

其中,x,y分别表示两个待计算相似度的待推荐对象,S(x,y)表示基于传 统关联推荐算法得到的两个待推荐对象的相似度,So(x,y)表示基于本体知识库 计算的相似度,α和β为基于传统推荐算法计算的相似度与基于本体的相似度的 不同权值,该权值可以根据项目实际情况进行适当调整。

(8)根据修正结果选出待推荐对象的邻居集并生成推荐列表;根据上述计 算相似度的方法计算出物品A有50个相似度物品,其相似度大于80%,而要求 是只推荐10个与物品A相关的相似度物品,就需要从50个相似度物品选出相似 度最高的10个物品进行推荐,这10个物品组成的集合就是邻居集合,然后用户 看到的邻居集合就是推荐列表。

本发明通过计算不同本体在本体库中的相似度,对传统的基于协同过滤计算 的相似度进行修正,属于关联推荐,知识库,数据挖掘等领域。其中,本发明中 的本体库定义为:由不同概念,概念产生的不同实体以及概念间的关系、实体间 的关系、概念与实体间的关系以及他们所具有的属性,所组成的集合。本发明中 的本体定义为根据上述提到的获取到的知识所抽象出来的概念或者实体化出来 的实体以及概念或者实体所具有的属性,本体库的范围包括但不限于上述提到的 待推荐对象。

本发明已经通过上述实施例进行了说明,但应当理解的是,上述实施例只是 用于举例和说明的目的,而非意在将本发明限制于所描述的实施例范围内。此外 本领域技术人员可以理解的是,本发明并不局限于上述实施例,根据本发明的教 导还可以做出更多种的变型和修改,这些变型和修改均落在本发明所要求保护的 范围以内。本发明的保护范围由附属的权利要求书及其等效范围所界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号