公开/公告号CN113342904A
专利类型发明专利
公开/公告日2021-09-03
原文格式PDF
申请/专利号CN202110354107.6
申请日2021-04-01
分类号G06F16/28(20190101);G06F16/2458(20190101);G06Q50/10(20120101);
代理机构37218 济南泉城专利商标事务所;
代理人支文彬
地址 250013 山东省济南市历下区科院路19号
入库时间 2023-06-19 12:27:31
技术领域
本发明涉及深度学习技术领域,具体涉及一种基于企业特征传播的企业服务推荐方法。
背景技术
随着经济的高速发展、中小微企业成为当前国家发展的重要力量,在改善民生,促进就业,刺激经济等方面有着不可替代的作用,其具有快速变化的业务和不完 善的企业服务供给体系,而企业服务对中小微企业的发展起着重要作用。在海量 的企业服务面前,难以精准的找到合适的企业服务方案,因此对于企业的服务方 案的智能推荐就显得尤为重要。
在以往的推荐系统中,主要传统推荐算法得到了广泛应用。随着深度学习的不断发展,其在推荐系统中也表现出优越的性能。但在这些推荐算法中,使用了普通 的交互信息以及辅助信息,但在企业服务推荐中,难以映射企业所属特征,以及 企业间的关联。手动设计企业关联的元路径工作量极大,很难更深的挖掘关联关 系,企业复杂的业务需求无法完整的反映,使得无法挖掘企业所需的潜在服务。
发明内容
本发明为了克服以上技术的不足,提供了一种通过对企业建立新结构特征传播模型,自动的通过企业特征知识图谱关系挖掘企业关联,通过一种新的损失函数结 合深度学习方法得到较好的推荐结果的方法。
本发明克服其技术问题所采用的技术方案是:
一种基于企业特征传播的企业服务推荐方法,包括如下步骤:
a)获取n个企业经营数据,该数据中每个企业具有企业属性表C、服务属性表S 及服务交互记录表R,将n个企业经营数据进行标准化处理;
b)在标准化处理后的数据中根据企业属性表C中的经营状态、所属行业、企业类型、经营范围和业务范围5个类别字段,使相同值进行连接,得到知识图谱
,其中head为头实体,tail为尾实体,e为头尾实体间关系;c)在服务交互记录表R中搜索目标预测服务s中包含的交互企业c′,s∈S,c′∈C,将搜索记录添加到目标预测服务s中形成企业交互集合Set
d)利用知识图谱
将企业交互集合Sete)随机初始化所有企业的embedding编码和n个转化矩阵r,n为传播次数,embedding编码和转化矩阵r的训练的目标为h×r=t,h为头实体的embedding, t为尾实体的embedding,h、r、t的维度均为d;
f)通过公式w
g)通过公式
h)随机初始化二维合并矩阵T∈R
i)重复步骤h)直至得到n个企业服务表示向量v
j)通过公式
k)通过公式
l)对企业属性表C中企业经营范围关键词使用multi-hot编码,得到编码后的输出结果I
m)对企业属性表C中企业风险类信息t
n)通过公式
o)将向量I
p)将向量I
q)利用公式
i)利用损失函数L使用Adam优化方法对企业特征传播网络模型进行优化;
s)保持优化后的企业特征传播网络模型的参数;
t)将优化后的企业特征传播网络模型的预测得分
进一步的,步骤a)中企业属性表C中包含字段有:企业名、经营状态、所属行 业、企业类型、经营范围、业务类型、营业执照数量、商标数量、著作权证数量、 专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、 到期专利数量、到期认证数量、企业纳税异常数量,经营异常数量,行政处罚数 量,欠税记录数量,股权出资,动产抵押数量;服务属性表S包含字段有:服务 编号、服务所属类型、服务价格;服务交互记录表R包含字段有:企业名、服务 编号。
进一步的,步骤a)中标准化处理的过程为:将服务交互记录表R中没有的企业 和服务在企业属性表C、服务属性表S中进行过滤,对于企业属性表C中的数值 型缺失,使用企业属性表C中该字段的平均值差值处理,对于企业属性表C中类 别缺失,使用相同所述行业对应该字段的众数补充。
进一步的,步骤b)中特征包括企业的经营状态、所述行业、企业类型、经营范 围、业务类型。
进一步的,步骤l)中证照类信息包含字段有:营业执照数量、商标数量、著作 权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作 权证数量、到期专利数量、到期认证数量。
进一步的,步骤m)中企业风险类信息包含字段有:企业纳税异常数量,经营异 常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量。
本发明的有益效果是:利用企业特征间关联的知识图谱,利用目标服务对交互记录中的企业进行特征传播,自动挖掘企业关联路径,刻画出企业之间关联特征, 与企业特征结合,利用新的损失函数结合深度学习得到企业与服务的交互概率, 能够解决通用框架仅使用交互数据以及基本信息而偏离企业间关系而导致的推 荐效果不好等问题,实现对企业的服务方案精准推荐。通过对企业间关系自动挖 掘,发现企业间关联路径,及企业特征进行交互预测评分,通过目标服务对交互 记录中企业的特征传播以及交互框架,来解决企业对服务方案选择困难的问题。
附图说明
图1为本发明的深度学习推荐网络框架图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一种基于企业特征传播的企业服务推荐方法,包括如下步骤:
a)获取n个企业经营数据,该数据中每个企业具有企业属性表C、服务属性表S 及服务交互记录表R,将n个企业经营数据进行标准化处理。
b)在标准化处理后的数据中根据企业属性表C中的经营状态、所属行业、企业类型、经营范围和业务范围5个类别字段,使相同值进行连接,得到知识图谱
,其中head为头实体,tail为尾实体,e为头尾实体间关系。c)在服务交互记录表R中搜索目标预测服务s中包含的交互企业c′,s∈S, c′∈C,将搜索记录添加到目标预测服务s中形成企业交互集合Set
d)为加强企业特征形式表达,我们使用企业关联传播集合,利用知识图谱
将企业交互集合Sete)随机初始化所有企业的embedding编码和n个转化矩阵r,n为传播次数,embedding编码和转化矩阵r的训练的目标为h×r=t,h为头实体的embedding, t为尾实体的embedding,h、r、t的维度均为d。
f)通过公式w
g)通过公式
h)随机初始化二维合并矩阵T∈R
i)重复步骤h)直至得到n个企业服务表示向量v
j)通过公式
k)我们设计了针对于网络的形式的损失函数,加入企业关联影响,使得embedding向量通过转化矩阵表达企业关联更准确,损失函数加入转化损失,由 于在不同传播次数下,较远的企业特征转化对损失的影响较小,因此加入了衰减 权重,因此通过公式
l)对企业属性表C中企业经营范围关键词使用multi-hot编码,得到编码后的输出结果I
m)企业属性表中风险类信息字段包括,企业纳税异常数量,经营异常数量,行 政处罚数量,欠税记录数量,股权出资,动产抵押数量。提取每种数量信息,对 企业属性表C中企业风险类信息t
n)通过公式
o)将向量I
p)将向量I
q)利用公式
i)利用损失函数L使用Adam优化方法对企业特征传播网络模型进行优化。优化 时利用Dropout防止过拟合,取值0.5。由于业务量有限,数据较为稀疏,为了 验证参数稳定性,可以采用7折交叉验证。
s)保持优化后的企业特征传播网络模型的参数。
t)将优化后的企业特征传播网络模型的预测得分
利用企业特征间关联的知识图谱,利用目标服务对交互记录中的企业进行特征传播,自动挖掘企业关联路径,刻画出企业之间关联特征,与企业特征结合,利用 新的损失函数结合深度学习得到企业与服务的交互概率,能够解决通用框架仅使 用交互数据以及基本信息而偏离企业间关系而导致的推荐效果不好等问题,实现 对企业的服务方案精准推荐。通过对企业间关系自动挖掘,发现企业间关联路径, 及企业特征进行交互预测评分,通过目标服务对交互记录中企业的特征传播以及 交互框架,来解决企业对服务方案选择困难的问题。
实施例1:
步骤a)中企业属性表C中包含字段有:企业名、经营状态、所属行业、企业类 型、经营范围、业务类型、营业执照数量、商标数量、著作权证数量、专利数量、 认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数 量、到期认证数量、企业纳税异常数量,经营异常数量,行政处罚数量,欠税记 录数量,股权出资,动产抵押数量;服务属性表S包含字段有:服务编号、服务 所属类型、服务价格;服务交互记录表R包含字段有:企业名、服务编号。
实施例2:
步骤a)中标准化处理的过程为:将服务交互记录表R中没有的企业和服务在企 业属性表C、服务属性表S中进行过滤,对于企业属性表C中的数值型缺失,使 用企业属性表C中该字段的平均值差值处理,对于企业属性表C中类别缺失,使 用相同所述行业对应该字段的众数补充。
实施例3:
步骤b)中特征包括企业的经营状态、所述行业、企业类型、经营范围、业务类 型。
实施例4:
步骤l)中证照类信息包含字段有:营业执照数量、商标数量、著作权证数量、 专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、 到期专利数量、到期认证数量。
实施例5:
步骤m)中企业风险类信息包含字段有:企业纳税异常数量,经营异常数量,行 政处罚数量,欠税记录数量,股权出资,动产抵押数量。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说, 其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特 征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、 改进等,均应包含在本发明的保护范围之内。
机译: 专用通信网络,用于传播与主题活动相关的信息,以及一种通过通信网络促进企业对企业销售的方法
机译: 基于网络的机器人的服务推荐方法及服务推荐装置
机译: 基于网络的机器人的服务推荐方法和服务推荐装置