首页> 中国专利> 一种基于用户偏好与知识图谱的个性化产品描述生成方法

一种基于用户偏好与知识图谱的个性化产品描述生成方法

摘要

本发明公开了一种基于用户偏好与知识图谱的个性化产品描述生成方法,通过对产品标题进行实体信息提取,再使用Graph Attention从外部知识库中提取与实体信息最相关的知识并进行融合,进一步增强实体中的知识;同时基于模型预测出用户的多个兴趣标签,再对用户进行聚类分析,通过TFIDF为同类用户构建专属的个性化词库;最后提出了一种多重指针生成网络融合来自产品标题、外部知识库与个性化词库中的知识,最终生成具有信息量、多样性的个性化产品描述。本发明能够通过产品标题与外部知识库,依据用户历史行为自动批量生成个性化的产品描述,解决人工撰写产品描述费事费力的问题。

著录项

  • 公开/公告号CN113032415A

    专利类型发明专利

  • 公开/公告日2021-06-25

    原文格式PDF

  • 申请/专利权人 西北工业大学;

    申请/专利号CN202110236093.8

  • 申请日2021-03-03

  • 分类号G06F16/24(20190101);G06F16/36(20190101);

  • 代理机构61204 西北工业大学专利中心;

  • 代理人金凤

  • 地址 710072 陕西省西安市友谊西路127号

  • 入库时间 2023-06-19 11:35:49

说明书

技术领域

本发明属于知识表示技术领域,具体涉及一种个性化产品描述生成方法。

背景技术

计算机与互联网技术极大的改变了人们的生活与行为方式,其中居民消费习惯的变化最为明显。依据商务部数据,2019年电子商务交易额已经达全年GDP的35.13%,可以看出,电子商务经济已经成为中国经济体系的重要组成部分。

与传统线下商店相不同,用户在网络空间中无法与产品实体进行交互,只能依靠产品描述进一步了解产品信息,从而做出购买决策。产品描述是用户获取产品信息的主要渠道,其目的是向顾客提供有关产品的特性和优点。传统的产品描述通常是由商家聘用“专家”,根据产品信息进行手工撰写。然而手工撰写商品描述效率低下且成本较高,对于公司推广产品来说是一个较大的负担。在互联网如此庞大的电商规模之下,传统的手工撰写产品描述的方式已无法满足新时代的需求。人类撰写的商品描述受限于撰写者的经验、知识、对于产品的了解程度,在这样大规模、高频率的产品更新的情况下,人类撰写者没有时间、也没有精力去了解每一个产品的详细情况,导致写出的商品描述质量难以保证。另一方面,人工撰写的产品描述难以满足个性化需求,大多是尽可能覆盖所有的产品卖点,不同用户看到的都是相同的产品描述,可能会导致用户无法瞬间抓取到自己感兴趣的信息,最终丧失了进一步了解产品的动力。

现有的关于商品描述和评论生成的方法,大多基于人工构建的规则或简单的生成模型,根据产品标题或结合外部知识库生成通用的产品描述。其仍然存在一些问题需要解决。首先,现有的方法大多停留在通用产品描述的层面,并没有考虑用户的偏好,从而进一步生成个性化的产品描述。其次,已有的方法大多仅利用产品标题作为输入信息。由于产品标题内包含的信息极为有限,因而生成的产品描述的信息量与多样性普遍不佳。第三,少部分方法引入了外部知识库用于丰富产品知识,但外部知识库中包含了大量冗余、低质的信息,对于这些信息,现有工作并没有很好的进行处理。

发明内容

为了克服现有技术的不足,本发明提供了一种基于用户偏好与知识图谱的个性化产品描述生成方法,通过对产品标题进行实体信息提取,再使用Graph Attention从外部知识库中提取与实体信息最相关的知识并进行融合,进一步增强实体中的知识;同时基于模型预测出用户的多个兴趣标签,再对用户进行聚类分析,通过TFIDF为同类用户构建专属的个性化词库;最后提出了一种多重指针生成网络融合来自产品标题、外部知识库与个性化词库中的知识,最终生成具有信息量、多样性的个性化产品描述。本发明能够通过产品标题与外部知识库,依据用户历史行为自动批量生成个性化的产品描述,解决人工撰写产品描述费事费力的问题。

本发明解决其技术问题所采用的技术方案包括以下步骤:

步骤1:获取产品描述数据集,采集互联网电商网站中的产品描述Y=(y

步骤2:以产品标题中的实体在知识库中进行检索,将检索出的知识G分为两个部分:关系r=DESC的知识表示为G

步骤3:将知识库中检索到的知识G

使用Attention机制选择知识,Attention机制描述为式(1):

其中,

步骤4:将知识库中检索到的知识G

使用Graph Attention对检索出的知识进行选择与整合,如以下式(2)所示:

其中,r

步骤5:由步骤1采集的用户评论数据对用户进行分类,根据用户类别获取该类别对应的产品描述,使用TF-IDF从产品描述中选取词汇构成用户专属个性化词库V

使用Attention机制对个性化词库V

其中,

步骤6:使用多重指针生成网络计算从知识库、个性化词库和产品标题中进行单词复制时的生成概率,表示为式(4):

其中,P

步骤7:计算最终生成的个性化产品描述词汇概率,表示为式(5):

其中

本发明的有益效果如下:

本发明能够通过产品标题与外部知识库,依据用户历史行为自动批量生成个性化的产品描述,解决人工撰写产品描述费事费力的问题,一定程度上降低中小企业运营成本。

附图说明

图1为本发明方法架构图。

图2本发明方法信息增强模块方法架构图。

图3为本发明实施例生成的个性化产品描述结果。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

本发明为基于用户偏好与知识图谱的个性化产品描述生成方法,设计了一种能够提取用户偏好的用户语言偏好提取方式,并提出了一种使从不同数据源中抽取高度相关异质数据的方法,并设计了合理的数据融合方式,最终生成信息丰富的个性化的产品描述。

如图1所示,一种基于用户偏好与知识图谱的个性化产品描述生成方法,包括以下步骤:

步骤1:获取产品描述数据集,采集互联网电商网站中的产品描述Y=(y

步骤2:如图2所示,以产品标题中的实体在知识库中进行检索,在知识库中,与实体的关系为“DESC”的值是实体的描述性文本,包含大量的信息,使用TransE进行编码会有较大的信息丢失,因此将检索出的知识G分为两个部分:关系r=DESC的知识表示为G

步骤3:将知识库中检索到的知识G

使用Attention机制选择其中最为重要的知识,Attention机制描述为式(1):

其中,

步骤4:将知识库中检索到的知识G

使用Graph Attention对检索出的知识进行选择与整合,如以下式(2)所示:

其中,r

步骤5:由步骤1采集的用户评论数据对用户进行分类,本方法分析用户偏好,根据用户类别获取该类别对应的产品描述,使用TF-IDF从产品描述中选取能够表达用户语言特点的特殊词汇构成用户专属个性化词库V

使用Attention机制对个性化词库V

其中,

步骤6:使用多重指针生成网络计算从知识库、个性化词库和产品标题中进行单词复制时的生成概率,表示为式(4):

其中,P

步骤7:计算最终生成的个性化产品描述词汇概率,表示为式(5):

其中

图3为采用本发明方法生成的个性化产品描述结果,从结果能够看出,针对同一个产品不同的用户类型生成了个性化的产品描述,达到了较好的效果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号