首页> 中国专利> 一种基于因果干预的反事实生成方法

一种基于因果干预的反事实生成方法

摘要

一种基于因果干预的反事实生成方法,涉及机器学习技术领域,针对现有反事实生成方法中每个新的实例都需要重新解决一个特定的优化问题,进而导致反事实生成效率低的技术问题,本申请通过对反事实因果干预的分析,为生成过程提供因果角度的理论保证;并适当地将模型偏差与属性之间的因果关系结合起来,以确保反事实解释的可行性;使用生成对抗网络与因果干预相结合,克服了原有方法针对一项实例就需要解决一个特定优化问题导致生成效率低下的难点,提高了反事实生成的效率。

著录项

  • 公开/公告号CN114897140A

    专利类型发明专利

  • 公开/公告日2022-08-12

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN202210499086.1

  • 发明设计人 王宏志;邵心玥;陈翔;朱霄;

    申请日2022-05-09

  • 分类号G06N3/04(2006.01);G06N3/08(2006.01);G06N20/00(2019.01);G06Q50/06(2012.01);

  • 代理机构哈尔滨华夏松花江知识产权代理有限公司 23213;

  • 代理人岳昕

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2023-06-19 16:22:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-30

    实质审查的生效 IPC(主分类):G06N 3/04 专利申请号:2022104990861 申请日:20220509

    实质审查的生效

说明书

技术领域

本发明涉及人工智能技术领域,具体为一种基于因果干预的反事实生成方法。

背景技术

近年来,人工智能方法在各种任务和领域都取得了巨大的成功,例如在图像分类、商品推荐、目标检测等方面,人工智能方法都有媲美甚至超越人类的表现。尽管人工智能方法在很多时候给出准确的预测,但在一些高风险场景下例如法庭、手术室,盲目被动的接受模型给出的预测是不明智的,并且令人们越来越不安。无法仔细观察这些决策算法是如何做出它们的预测,这就是目前我们面临的黑盒问题。可解释性已经成为了已经成为可解释AI(XAI)的主要驱动支柱。现在的很多解释方法都集中在通过拟合黑盒模型的输出来计算与预测相关的特征的重要性,并为它们排名上。这样的方法无法从因果关系中分离出相关性,在XAI中应该强调因果方法,以促进对用户更高程度的可解释性。反事实解释就是能够结合因果关系进行解释的方法。

最近有许多关于生成反事实的尝试工作,最主要的一类方法扩展自Lewis最初提出的数据点之间最小距离的概念,目标是找到一个反事实的,尽可能接近原始点xi,这样就可以找到一个新的目标(反事实)。这类方法主要在损失函数描述、相应的优化算法和距离函数的定义上提出不同的创新和提升。另外一些方法是利用对抗扰动在输入数据空间内搜索反事实,这种方法的一个缺点是无法避免分布外(OOD)样本,这在很大程度上限制了生成的反事实的推理能力。尽管已有各式各样的反事实生成方法,但有效地生成具有因果性的反事实解释仍然面临挑战。常见的反事实方法都是基于实例的,这使得它们在面临大量反事实生成需求时效率低下,因为每个新的实例都需要重新解决一个特定的优化问题。

发明内容

本发明的目的是:针对现有反事实生成方法中每个新的实例都需要重新解决一个特定的优化问题,进而导致反事实生成效率低的技术问题,提出一种基于因果干预的反事实生成方法。

本发明为了解决上述技术问题采取的技术方案是:

一种基于因果干预的反事实生成方法,包括以下步骤:

步骤一:获取待解释数据集,然后得到待解释数据集的结构因果模型X→Z←Y,所述待解释数据集为电网潮流数据集;

步骤二:将结构因果模型X→Z←Y输入隐式因果生成器得到因果隐式生成模型L

步骤三:获取待解释数据集中的实例q和先验分布噪声z,所述实例q为电网运行状态;

步骤四:利用实例q和先验分布噪声z训练对抗网络;

步骤五:利用训练好的对抗网络中的生成器生成反事实;

所述结构因果模型X→Z←Y表示为:

X=f

Y=f

Z=f

其中,X、Y和Z为结构因果模型的内生变量,N

进一步的,所述步骤四中训练对抗网络的具体步骤为:

步骤四一:初始化生成器的参数θ

步骤四二:首先,从待解释数据集中随机采样m个实例x,然后从先验分布噪声中随机采样m个噪声样本,最后根据采集到的m个噪声样本并结合生成器生成m个伪实例G(z|q,L

步骤四三:利用采集到的m个实例和生成器生成的m个伪实例G(z|q,L

其中,D为鉴别器,G为生成器,L

步骤四四:重复执行步骤四二和步骤四三k次,得到更新好的鉴别器;

步骤四五:从先验分布噪声中随机采样m个噪声样本,根据采集到的m个噪声样本并结合生成器生成m个伪实例G(z|q,L

步骤四六:利用生成器生成的m个伪实例并结合如下公式更新生成器的参数θ

步骤四七:重复步骤四二至步骤四六,直至对抗网络达到纳什均衡状态,即损失函数达到预设值,则完成训练。

进一步的,所述损失函数表示为:

其中,f为训练好的黑盒机器学习模型,所述黑盒机器学习模型的训练过程为:

首先,获取待解释数据集,然后得到待解释数据集对应的预测结果,最后利用待解释数据集作为输入,利用待解释数据集对应的预测结果作为输出训练黑盒机器学习模型。

进一步的,所述L

L

其中,L

进一步的,所述黑盒机器学习模型为决策树、随机森林或XGBOOST。

进一步的,所述m为32。

进一步的,所述k为1-10次。

进一步的,所述k为5次。

本发明的有益效果是:

本申请通过对反事实因果干预的分析,为生成过程提供因果角度的理论保证;并适当地将模型偏差与属性之间的因果关系结合起来,以确保反事实解释的可行性;使用生成对抗网络与因果干预相结合,克服了原有方法针对一项实例就需要解决一个特定优化问题导致生成效率低下的难点,提高了反事实生成的效率。

附图说明

图1为本申请的整体流程示意图;

图2为反映因果图结构的因果生成器。

具体实施方式

需要特别说明的是,在不冲突的情况下,本申请公开的各个实施方式之间可以相互组合。

具体实施方式一:参照图1具体说明本实施方式,本实施方式所述的一种基于因果干预的反事实生成方法,包括以下步骤:

一种基于因果干预的反事实生成方法,包括以下步骤:

步骤一:获取待解释数据集,然后得到待解释数据集的结构因果模型X→Z←Y,所述待解释数据集为电网潮流数据集;

步骤二:将结构因果模型X→Z←Y输入隐式因果生成器得到因果隐式生成模型L

步骤三:获取待解释数据集中的实例q和先验分布噪声z,所述实例q为电网运行状态;

步骤四:利用实例q和先验分布噪声z训练对抗网络;

步骤五:利用训练好的对抗网络中的生成器生成反事实;

所述结构因果模型X→Z←Y表示为:

X=f

Y=f

Z=f

其中,X、Y和Z为结构因果模型的内生变量,N

而本申请的重点在于:

1、基于潜在因果机制与因果干预理论分析了反事实生成的过程,为反事实生成过程提供因果保证以及更好的逼近潜在的反事实宇宙。

2、基于前馈神经网络设计了一个隐式因果控制器,将属性的因果性纳入生成的反事实样本中,提高生成解释的实际可行性。

3、基于对抗生成网络设计了一个基于模型的反事实生成方法,面对大规模的反事实查询需求时,能够更有效准确的生成反事实。

本申请的操作步骤如下:

步骤一:获取待解释的数据集与黑盒机器学习算法,并将算法应用在该数据集上进行训练;

步骤二:获取待解释数据集的结构因果图;

步骤三:用因果生成器学习给定结构因果图的因果隐式生成模型L

步骤四:利用上述步骤得到的因果隐式生成模型L

步骤五:输入需要生成反事实的原始实例q,先验分布噪声z,数据集到生成对抗网络;

步骤六:初始化生成器θ

步骤七:从数据集中采样m个实例{x

步骤八:更新判别器的参数θ

步骤九:返回步骤七、八,循环训练k次;

步骤十:重新从先验分布噪声中采样m个噪声样本{z

步骤十一:更新生成器的参数θ

步骤十二:返回步骤七循环训练,直到网络达到纳什均衡状态,即满足下述损失公式

步骤十三:后续的反事实查询可以直接输入已经预训练好的生成对抗网络进行反事实解释的获取。由于训练好的生成网络的鉴别器是无法分辨最终选择的数据是来自于真实的数据分布,抑或是来自生成器的生成,我们可以认为最终生成的反事实也是符合原始数据分布的,因此能够得到结合因果关系、并且符合原始数据分布且具有可行性的反事实解释。

综上可知,现有技术存在如下问题:

第一,常见的反事实方法都是基于实例的,这使得它们在面临大量反事实解释需求时效率低下,因为每个新的实例都需要重新解决一个特定的优化问题;

第二,大量基于距离的方法的优化目标是找到尽可能最近的数据点,但没有考虑这样生成的反事实解释由于缺乏考虑特征之间的因果依赖关系,导致反事实解释不具有可行性;

第三,虽然已经有一些工作通过添加额外的正则化约束将因果约束结合进反事实,但从因果的角度对生成过程没有任何理论保证。

而本申请针对现有技术存在的技术问题,本申请通过对反事实因果干预的分析,为生成过程提供因果角度的理论保证;并适当地将模型偏差与属性之间的因果关系结合起来,以确保反事实解释的可行性;使用生成对抗网络与因果干预相结合,克服了原有方法针对一项实例就需要解决一个特定优化问题导致生成效率低下的难点,提高了反事实生成的效率。

银行采用贷款风险预测模型来判断一个人是否能获得贷款,如果有人的贷款请求被拒绝,生成的反事实解释可以为他们提供反馈,帮助他们改变自己的特征,从而使得自己的条件能够被决策方法分类信用良好,从而实现获得贷款的目的。

反事实解释是一种通过修改某些先决条件来评估可能结果的假设性思维过程。在语言类任务中,反事实解释可以实现对故事背景进行微小修改的情况下创造出可信的相反结局。

对零部件异常预测模型进行反事实解释,可以为被预测为会出现异常的零部件提供维修方案以保证该零部件不会被预测为异常,从而降低实际的故障发生概率。

本申请格式限定就是csv表格格式的数据集,允许有连续和离散特征,带有分类标签。

如果数据集是信用预测相关的,那反事实的意义是如果一个人的信用被预测为不良,反事实解释可以给她提供建议,告诉她如何以最小的修改代价帮助自己的信用被预测为良好。如果数据集是疾病预测的,那反事实的意义是如果一个人被预测为某种疾病的高风险人群,反事实解释可以给他提供建议,告诉他如何调整以减少被预测为会患上某种疾病的概率。

需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不能以此限定权利保护范围。凡根据本发明权利要求书和说明书所做的仅仅是局部改变的,仍应落入本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号