法律状态公告日
法律状态信息
法律状态
2023-06-23
授权
发明专利权授予
2022-09-02
实质审查的生效 IPC(主分类):G06F16/9535 专利申请号:2022104373566 申请日:20220421
实质审查的生效
技术领域
本发明涉及会话推荐技术领域,具体地说是一种基于用户偏好图的多子目标对话推荐方法。
背景技术
随着互联网上信息量的不断增加,人们越来越难以从中甄别自己感兴趣的内容。推荐系统的出现正是为了解决“信息超载”的问题,它会预测用户的需求,并向用户推荐他们最可能喜欢的内容。传统推荐利用历史交互信息估计用户偏好,难以处理历史信息稀疏、有噪音或者用户偏好改变的情况。而对话推荐系统(Conversational RecommendationSystem,CRS)与用户进行动态交互,能够在对话过程中直接询问用户偏好,强调用自然语言进行交互并获取明确反馈。
近期的对话推荐工作提出了用于建立多子目标推荐对话系统的DuRecDial数据集,标注了闲聊、问答、推荐三大主题内的21个细化子目标,并将对话按子目标划分为若干个阶段。该任务旨在使系统规划多种子目标主动引导对话走向,将对话从问答、关于明星的闲聊等非推荐场景引入到电影推荐、音乐推荐等推荐场景。多子目标推荐对话系统使用知识库中的信息帮助完成问答、推荐等过程,因此知识的准确选择对于生成高质量的对话至关重要。
现有技术的多子目标推荐对话方法,大多直接使用给定知识库中所有的知识而不对其进行甄别,不仅增加了计算量,还可能引入大量噪音知识。
发明内容
本发明的目的是针对现有技术的不足而设计的一种基于用户偏好图的多子目标对话推荐方法,采用构建的用户偏好图,利用关键实体预测模块预测下一轮对话内容的关键实体,并由对话生成模块生成每一轮系统对历史对话的回复,基于用户的在线反馈确定对话结束或进入下一轮对话。该方法实现了多子目标对话推荐,不但提高了对话推荐准确率和生成回复的一致性,还增强了模型的可解释性,方法简便,计算量少,大大减少了噪音知识,推荐准确率高,可广泛应用于社交对话推荐系统,具有很好的运用前景。
本发明的目的是这样实现的:一种基于用户偏好图的多子目标对话推荐方法,其特点是采用构建的用户偏好图K
a步骤:建立用户偏好图构建模块
a-1:在对话开始前,基于用户配置文件初始化用户偏好图K
a-2:在对话进行时,根据实体文件匹配对话中提及的实体,并通过基于预训练的语言模型(BERT)预测用户的实体级偏好;
a-3:根据用户实体级偏好更新用户偏好图K
b步骤:建立关键实体模块
基于当前用户偏好图K
c步骤:建立对话生成模块
基于历史对话、用户偏好图K
所述a-1步骤中的初始化用户偏好图K
1.1取多子目标对话数据的用户配置文件中用户接受的实体和知识图谱中存在实体的交集作为用户偏好图K
1.2取知识图谱中的用户偏好图K
所述a-2步骤中的实体级偏好具体包括以下步骤:
1.3基于所述知识图谱中的实体信息,处理出实体文件并依据实体文件匹配对话中提及的实体E;其中,提及的实体分为用户提及实体E
1.4基于所述用户提及实体e
F
H
A(e
或者基于所述对话推荐系统提及实体e
F
H
A(e
所述b步骤2中更新用户偏好图K
1.5在每轮对话开始前将用户偏好图K
w
1.6基于所述用户对所述提及实体的态度,用户接受的实体及其在知识库中周围一跳的点和边被加入用户偏好图K
1.7当用户偏好图K
所述b步骤中确定候选关键实体并通过BERT模型预测关键实体具体包括以下步骤:
2.1通过基于Transformer的方法预测下一个子目标g
其中,
2.2由子目标g
2.3基于预训练的BERT模型给候选关键实体打分,取分数最高的候选实体作为关键实体。
2.4基于用户偏好图K
F
F
H=BERT([[CLS];g
S(E
其中:h
所述c步骤中的通过深度神经网络模型生成回复具体包括以下步骤:
3.1将步骤2.1中所述的子目标g
3.2在非推荐子目标下,将用户偏好图中所有的知识三元组K
F=[s
E
其中,E
3.3基于知识特征E
3.4为了将知识信息整合到回复中,在解码器上采用了复制机制。具体来说,单词概率P(w)是通过下述(p)~(s)式所表示的复制机制计算:
其中,W
3.5通过下述(t)式的优化交叉熵损耗训练对话框生成模块:
本发明与现有技术相比具有以下显著的技术进步和优点:
1)高推荐准确率,本发明提出的用户偏好图关注用户在近期话题中体现出的实体级偏好对后续话题的贡献,大幅提升了推荐准确率;
2)生成回复高一致性,本发明提出的用户偏好图建模了用户在历史对话中表现出的阶段性实体级偏好,关键实体相关的三元组为对话模块提供更加精确的后续内容指导,两者都为对话模块提供了更加精确的知识,避免知识图谱中的噪音知识带来的影响,提升了生成回复的一致性;
3)模型的可解释性,本法明采用的方法能够提供人类可解读的更加精确的相关知识,根据这些知识人类倾向于做出跟模型较为一致的预测,提高了模型的可解释性。
附图说明
图1为本发明流程图。
具体实施方式
以下结合具体实施例和附图,对本发明做进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制的内容。
实施例1
参阅图1,本发明主要包括以下步骤:
步骤一:初始化用户偏好图
取所述多子目标对话数据的用户配置文件中用户接受的实体和所述知识图谱中存在实体的交集作为用户偏好图K
步骤二:预测关键实体
通过基于Transformer的方法预测下一个子目标g
其中,
然后,基于由所述子目标g
F
F
H=BERT([[CLS];g
S(E
其中,h
步骤三:进行对话生成
对话生成模块基于所述对话历史、所述关键实体及所述用户偏好图K
在非推荐子目标下,将用户偏好图K
F=[s
E
其中,E
然后,基于知识特征E
其中,W
通过下述(t)式的优化交叉熵损耗训练对话框生成模块:
若对话未结束,则继续进行步骤四。
步骤四:更新用户偏好图
基于所述知识图谱中的实体信息,处理出实体文件并依据实体文件匹配对话中提及的实体E;其中,提及的实体分为用户提及实体E
F
H
A(e
或者基于所述对话推荐系统提及实体e
F
H
A(e
然后,在每轮对话开始前将用户偏好图K
以上只是对本发明作进一步的说明,并非用以限制本专利,凡为本发明等效实施,均应包含于本专利的权利要求范围之内。
机译: 一种基于计算机的方法,用于向营销人员和销售人员推荐与其他类似用户分组的个人用户,这些用户具有使用动态计算的相似度因子确定的用户组
机译: 一种基于第二用户的观看活动向第一用户推荐媒体资产以包括在第二用户的播放列表中的方法和系统
机译: 一种基于多准则粗糙-模糊方法的基于用户偏好的推荐方法和系统