首页> 中国专利> 人工智能体决策防范伦理风险虚拟实验方法和机器人

人工智能体决策防范伦理风险虚拟实验方法和机器人

摘要

人工智能体决策防范伦理风险虚拟实验方法和机器人,包括:场景获取步骤;人工智能体行为决策选项步骤;第一选择步骤;获取操作步骤;操作对应人工智能体行为决策步骤;获取决策执行结果步骤;更新场景步骤;第一选择结果评价步骤。上述方法、系统和机器人,通过虚拟实验以及自动虚拟实验和决策选项、原因选项、风险选项考核相结合,来提高虚拟实验的效果,使得用户不但能掌握人工智能体决策防范风险的实验过程,还能掌握人工智能体决策防范风险的原因分析、风险评估等能力。

著录项

  • 公开/公告号CN112446504A

    专利类型发明专利

  • 公开/公告日2021-03-05

    原文格式PDF

  • 申请/专利权人 华南师范大学;

    申请/专利号CN202011304387.1

  • 发明设计人 朱定局;

    申请日2020-11-19

  • 分类号G06N20/00(20190101);

  • 代理机构44224 广州华进联合专利商标代理有限公司;

  • 代理人杨欢

  • 地址 510000 广东省广州市华南师范大学石牌校区

  • 入库时间 2023-06-19 10:06:57

说明书

技术领域

本发明涉及人工智能技术领域,特别是涉及一种人工智能体决策防范伦理风险虚拟实验方法和机器人。

背景技术

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有的人工智能体决策的人工智能伦理风险及其防范无法进行实验,因为该实验存在着人工智能伦理风险,会给参与实验的人员带来危险。

因此,现有技术还有待于改进和发展。

发明内容

基于此,有必要针对现有技术的缺陷或不足,提供人工智能体决策防范伦理风险虚拟实验方法和机器人,以解决现有技术中人工智能体决策防范伦理风险实验无法进行的问题。

第一方面,本发明实施例提供一种人工智能方法,所述方法包括:

场景获取步骤:获取事件的场景;

人工智能体行为决策选项步骤:获取人工智能体行为决策的多个选项,提示用户从所述多个选项中选择出在所述场景中符合人工智能伦理规则的人工智能体行为决策的正确选项;

第一选择步骤:获取用户对所述多个选项进行虚拟实验的请求或用户对人工智能体行为决策的多个选项的第一选择结果;若获取到用户对所述多个选项进行虚拟实验的请求,则继续执行;若获取到用户对所述多个选项的第一选择结果,则跳到第一选择结果评价步骤继续执行;

获取操作步骤:获取用户对所述虚拟实验中场景的操作;

操作对应人工智能体行为决策步骤:根据所述操作确定所述操作对应的人工智能体行为决策;

获取决策执行结果步骤:获取所述人工智能体行为决策的执行结果;

更新场景步骤:根据所述执行结果更新所述虚拟实验中的场景;

第一选择结果评价步骤:获取在所述场景中符合人工智能伦理规则的人工智能体行为决策的正确选项,将所述第一选择结果与所述正确选项进行对比,判断用户的选择是否正确作为对所述第一选择结果的评价结果。

优选地,所述方法还包括:

符合人工智能伦理规则原因选项步骤:显示人工智能体行为决策的正确选项,获取人工智能体行为决策的正确选项符合人工智能伦理规则的原因的多个选项,提示用户从所述多个选项中选择出人工智能体行为决策的正确选项符合人工智能伦理规则的原因的选项;

第二选择步骤:获取用户对人工智能体行为决策的正确选项符合人工智能伦理规则的原因的多个选项的选择结果,作为第二选择结果;

第二选择结果评价步骤:获取人工智能体行为决策的正确选项符合人工智能伦理规则的原因的正确选项,将所述第二选择结果与所述正确选项进行对比,判断用户的选择是否正确作为对所述第二选择结果的评价结果。

优选地,所述方法还包括:

人工智能伦理风险选项步骤:显示人工智能体行为决策的正确选项符合人工智能伦理规则的原因的正确选项,获取人工智能体行为决策的正确选项可能产生的人工智能伦理风险的多个选项,提示用户从所述多个选项中选择出人工智能体行为决策的正确选项可能产生的人工智能伦理风险的选项;

第三选择步骤:获取用户对人工智能体行为决策的正确选项可能产生的人工智能伦理风险的多个选项的选择结果,作为第三选择结果;

第三选择结果评价步骤:获取人工智能体行为决策的正确选项可能产生的人工智能伦理风险的正确选项,将所述第三选择结果与所述正确选项进行对比,判断用户的选择是否正确作为对所述第三选择结果的评价结果。

优选地,所述方法还包括:

人工智能体自动虚拟实验与决策请求步骤:获取用户进行人工智能体自动虚拟实验与决策的请求;

人工智能体自动虚拟实验与决策动画步骤:播放人工智能体自动虚拟实验与决策的动画;所述人工智能体自动虚拟实验与决策的动画中包括输入场景、算法的执行、输出结果;所述人工智能体自动虚拟实验与决策的动画中输出结果包括符合人工智能伦理规则的场景预测、符合人工智能伦理规则的人工智能体行为预测、是否符合人工智能伦理规则的判断、人工智能体行为的人工智能伦理风险的评定;

虚拟实验结果一致判断步骤:显示人工智能体自动虚拟实验与决策的动画中输出结果与用户进行虚拟实验的结果是否一致的判断的多个选项;

第四选择步骤:获取用户对所述是否一致的判断的多个选项的选择结果,作为第四选择结果;

第四选择结果评价步骤:显示所述是否一致的判断的正确选项,将所述第四选择结果与所述正确选项进行对比,判断用户的选择是否正确作为对所述第四选择结果的评价结果。

优选地,所述方法还包括:

执行正确行为决策请求步骤:获取用户对执行正确的人工智能体行为决策的请求;

播放执行场景步骤:播放执行正确的人工智能体行为决策的虚拟实验中的场景。

优选地,

所述第一选择步骤还包括:获取需要进行虚拟实验的选项;

所述获取操作步骤还包括:显示所述操作的内容;获取所述操作的操作位置和操作类型;

所述操作对应人工智能体行为决策步骤还包括:根据所述操作位置和操作类型确定所述操作对应的人工智能体行为决策;获取用户对所述人工智能体行为决策进行执行的请求;若获取到用户对所述人工智能体行为决策进行执行的请求,则判断所述操作对应的人工智能体行为决策是否属于所述需要进行虚拟实验的选项:是,则继续执行;否,则向用户提示操作错误,并回到所述获取操作步骤重新执行;若获取到用户对所述虚拟实验中场景的操作,则回到所述获取操作步骤继续执行。

优选地,

所述获取决策执行结果步骤还包括:显示所述执行结果的内容;

所述更新场景步骤还包括:根据所述执行结果更新所述场景中人工智能体的行为状态;根据所述执行结果更新所述场景中与所述执行结果相关的对象的行为状态;

所述方法还包括:

重新虚拟实验步骤:获取用户重新进行所述虚拟实验的请求;在获取到用户重新进行所述虚拟实验的请求后回到所述获取操作步骤重新执行;

退出虚拟实验步骤:获取用户退出所述虚拟实验的请求;在获取到用户退出所述虚拟实验的请求后回到所述人工智能体行为决策选项步骤重新执行;

实验记录步骤:将所述用户、所述操作的时间、所述选择的时间、所述操作内容、所述执行结果、所述第一选择结果、所述第一选择结果的评价结果存入数据库并记录进实验报告。

第二方面,本发明实施例提供一种人工智能装置(第二方面中的各模块的内容与第一方面各步骤的内容一一对应,所以第二方面中的各模块的内容不再赘述)

所述装置包括:场景获取模块;人工智能体行为决策选项模块;第一选择模块;获取操作模块;操作对应人工智能体行为决策模块;获取决策执行结果模块;更新场景模块;第一选择结果评价模块。

优选地,所述装置还包括:符合人工智能伦理规则原因选项模块;第二选择模块;第二选择结果评价模块。

优选地,所述装置还包括:人工智能伦理风险选项模块;第三选择模块;第三选择结果评价模块。

优选地,所述装置还包括:人工智能体自动虚拟实验与决策请求模块;人工智能体自动虚拟实验与决策动画模块;虚拟实验结果一致判断模块;第四选择模块;第四选择结果评价模块。

优选地,所述装置还包括:执行正确行为决策请求模块;播放执行场景模块。

优选地,所述装置还包括:重新虚拟实验模块;退出虚拟实验模块;实验记录模块。

第三方面,本发明实施例提供一种人工智能伦理系统,所述系统包括第二方面实施例任意一项所述装置的模块。

第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面实施例任意一项所述方法的步骤。

第五方面,本发明实施例提供一种机器人,包括存储器、处理器及存储在存储器上并可在处理器上运行的人工智能机器人程序,所述处理器执行所述程序时实现第一方面实施例任意一项所述方法的步骤。

本实施例提供的人工智能体决策防范伦理风险虚拟实验方法和机器人,包括:场景获取步骤;人工智能体行为决策选项步骤;第一选择步骤;获取操作步骤;操作对应人工智能体行为决策步骤;获取决策执行结果步骤;更新场景步骤;第一选择结果评价步骤。上述方法、系统和机器人,通过虚拟实验以及自动虚拟实验和决策选项、原因选项、风险选项考核相结合,来提高虚拟实验的效果,使得用户不但能掌握人工智能体决策防范风险的实验过程,还能掌握人工智能体决策防范风险的原因分析、风险评估等能力。

附图说明

图1为本发明的实施例提供的人工智能方法的流程图;

图2为本发明的实施例提供的人工智能方法的流程图;

图3为本发明的实施例提供的人工智能方法的流程图;

图4为本发明的实施例提供的人工智能方法的流程图;

图5为本发明的实施例提供的人工智能方法的流程图;

图6为本发明的实施例提供的人工智能方法的流程图;

图7为页面1和动画1;

图8为页面2和动画2;

图9为页面3和动画3;

图10为页面4和动画4;

图11为页面5和动画5;

图12为页面6和动画6;

图13为页面7和动画7;

图14为页面8和动画8;

图15为页面9和动画9;

图16为页面10和动画10;

图17为页面11和动画11;

图18为页面12和动画12;

图19为页面13和动画13;

图20为页面14和动画14;

图21为页面15和动画15;

图22为页面16和动画16;

图23为页面17和动画17;

图24为页面18和动画18;

图25为页面19和动画19;

图26为页面20和动画20;

图27为页面21和动画21;

图28为页面22和动画22;

图29为页面23和动画23;

图30为页面24和动画24;

图31为页面25和动画25左、动画25右;

图32为页面26和动画26左、动画26右;

图33为页面27和动画27左、动画27右;

图34为页面28和动画28左、动画28右;

图35为页面29和动画29;

图36为页面30和动画30。

具体实施方式

下面结合本发明实施方式,对本发明实施例中的技术方案进行详细地描述。

本发明的基本实施例

一种人工智能方法,如图1所示,所述方法包括:场景获取步骤;人工智能体行为决策选项步骤;第一选择步骤;获取操作步骤;操作对应人工智能体行为决策步骤;获取决策执行结果步骤;更新场景步骤;第一选择结果评价步骤。技术效果:所述方法通过不同的人工智能体行为决策选项的虚拟实验,使得用户能够通过虚拟实验来体验不同决策选项的执行效果,从而为用户对决策选项的选择提供依据,使得用户能够带着选项的问题去做虚拟实验,然后又能根据虚拟实验的结果进行选项的选择,能够使得用户将实验和选项问题结合起来,将实验与选择形式的考核结合起来,起到实验与考核相互促进的效果。并且通过自动比对来判断用户的操作和对决策选项的选择是否正确,来提高用户的实验能力和实验成效。

在其中一个优选实施例中,如图2所示,所述方法还包括:符合人工智能伦理规则原因选项步骤;第二选择步骤;第二选择结果评价步骤。技术效果:所述方法通过原因选项使得用户能够通过原因选项思考人工智能体决策能够防范伦理风险的原因,从而使得学生做完实验与考核之后,能够知其然,也能够知其所以然,从而提高实验的效果。并且通过自动比对来判断用户的对原因选项的选择是否正确,来提高用户的实验能力和实验成效。

在其中一个优选实施例中,如图3所示,所述方法还包括:人工智能伦理风险选项步骤;第三选择步骤;第三选择结果评价步骤。技术效果:所述方法通过风险选项来使得用户能够思考人工智能体决策选项可能产生的伦理风险,从而提高学生对伦理风险的判断能力。并且通过自动比对来判断用户的对风险选项的选择是否正确,来提高用户的实验能力和实验成效。

在其中一个优选实施例中,如图4所示,所述方法还包括:人工智能体自动虚拟实验与决策请求步骤;人工智能体自动虚拟实验与决策动画步骤;虚拟实验结果一致判断步骤;第四选择步骤;第四选择结果评价步骤。技术效果:所述方法通过自动虚拟实验来使得用户能够知晓人工智能体自动地进行虚拟实验的过程,并且能够将自动虚拟实验与用户进行的虚拟实验进行对比,从而加深用户对虚拟实验的理解,并且能增强用户对虚拟实验的掌握。

在其中一个优选实施例中,如图5所示,所述方法还包括:执行正确行为决策请求步骤;播放执行场景步骤。技术效果:所述方法通过执行人工智能体行为决策,让用户能真实地看到行为决策的执行结果,从而使得用户对实验有真实的体验感。

在其中一个优选实施例中,如图6所示,所述方法还包括:重新虚拟实验步骤;退出虚拟实验步骤;实验记录步骤。技术效果:所述方法可以使得用户重新进行虚拟实验来改进实验的效果。

本发明的优选实施例

2.1显示虚拟实验的算法的输入、流程、输出的原理图;

2.2

5

5.1

6

6.1.1所述人工智能体包括机器人或无人车。

6.1.2所述人工智能体的行为状态包括移动或射击或撞击或说话或受伤或其他行为状态或多种行为状态的组合。

6.2.1所述相关的对象包括人类或装置。

6.2.2所述相关的对象的行为包括移动或射击或撞击或说话或受伤或其他行为状态或多种行为状态的组合。

10

11.1播放人工智能体行为决策的正确选项对应的虚拟实验中的场景;

14

14.1播放人工智能体行为决策的正确选项对应的虚拟实验中的场景;

17显示人工智能体行为决策的正确选项可能产生的人工智能伦理风险的正确选项;

20

23

24

25将所述用户、所述选择的时间、所述第二、三、四选择结果、所述第二、三、四选择结果的评价结果存入数据库并记录进实验报告。

本发明的其他实施例

如图7,左下角场景(可缩放)播放“从警车开始追赶逃犯车辆并射击,直至出现等待区和阻止区”的动画,点击重播可重播该动画,点击进入实验场景后用户可与场景中对象进行交互。

如图8,左下角播放“从警车开始追赶逃犯车辆并射击,直至出现等待区和阻止区”的动画,点重新播放时可重播“从开始追赶,直至出现等待区和阻止区”的动画。

如图8,用户点击开始虚拟实验,则进入如图9。如图9,左边的动画是“从警车开始追赶逃犯车辆并射击,直至出现等待区和阻止区”,点重播时,重播该动画。

如图9,用户点“进入虚拟实验”,则进入如图10。

如图10,点放大,则进入如图11。

如图11,若用户点击等待区,然后点击执行虚拟实验。如图12,动画显示“从出现等待区和阻止区,直至无人车开到等待区,警车继续追赶无人车”,不符合规则中的法则一,不存在风险。(说明:用户操作后,在下方显示操作内容,点击执行虚拟实验后,画面中显示出虚拟实验的结果,并在下方显示虚拟实验结果的内容。用户操作和虚拟实验的结果全部记录进该用户的虚拟实验数据表中。点击重新开始虚拟实验又进入等待操作的状态画面。)

如图12,若点击缩小,则复原到如图13。

如图13,若点击重新开始虚拟实验,则进入如图14,虚拟实验时场景恢复到初始状态。

如图14,若用户点击警车前面的阻止区,然后点击执行虚拟实验。如图15,动画显示“从出现等待区和阻止区,直至警察被无人车阻止,逃犯车辆逃走”,符合规则,存在“救助坏人”风险。(说明:用户操作后,在下方显示操作内容,点击执行虚拟实验后,画面中显示出虚拟实验的结果,并在下方显示虚拟实验结果的内容。用户操作和虚拟实验的结果全部记录进该用户的虚拟实验数据表中。点击重新开始虚拟实验又进入等待操作的状态画面。)

如图15,若点击重新开始虚拟实验,则进入如图16,虚拟实验时场景恢复到初始状态。

如图17,若用户点击逃犯车辆,然后点击执行虚拟实验,动画显示“从出现等待区和阻止区,直至无人车向逃犯车辆撞击,逃犯车辆内部罪犯被撞伤”,不符合规则中的法则一,存在风险“无必要地伤害坏人”。(说明:用户操作后,在下方显示操作内容,点击执行虚拟实验后,画面中显示出虚拟实验的结果,并在下方显示虚拟实验结果的内容。用户操作和虚拟实验的结果全部记录进该用户的虚拟实验数据表中。点击重新开始虚拟实验又进入等待操作的状态画面。)

如图17,若点击重新开始虚拟实验,则进入如图18,虚拟实验时场景恢复到初始状态。

如图19,若用户点击逃犯车辆前面的阻止区,然后点击执行虚拟实验,动画显示“从出现等待区和阻止区,直至无人车挡住逃犯车辆,警车也开到逃犯车辆的前面挡住逃犯车辆”,不符合规则中的法则一,不存在风险。(说明:用户操作后,在下方显示操作内容,点击执行虚拟实验后,画面中显示出虚拟实验的结果,并在下方显示虚拟实验结果的内容。用户操作和虚拟实验的结果全部记录进该用户的虚拟实验数据表中。点击重新开始虚拟实验又进入等待操作的状态画面。)

上面各虚拟实验的顺序可以进行改变,无固定的顺序。如图19,若用户点击退出虚拟实验,进入如图20。如图20,左下角播放“从警车开始追赶逃犯车辆并射击,直至出现等待区和阻止区”的动画,点重新播放时可重播该动画。

如图20,用户选择答案后点击“提交答案“,如图21,显示正确答案。如下页面,左下角播放“从出现等待区和阻止区直至无人车阻挡警车,逃犯车辆逃走”的动画,点重新播放时可重播该动画。

如图21,点击“开始人工智能伦理判断”后,如图22,左侧循环播放“从出现等待区和阻止区直至无人车阻挡警车,逃犯车辆逃走”的动画,点重新播放时可重播该动画。

如图22,用户点击“提交答案“后,显示如图23,左侧循环播放“从出现等待区和阻止区直至无人车阻挡警车,逃犯车辆逃走”的动画,点重新播放时可重播该动画。

如图23,用户点击“开始风险评定“后进入如下页。如图24,左侧循环播放“从出现等待区和阻止区直至无人车阻挡警车,逃犯车辆逃走”的动画,点重新播放时可重播该动画。

如图24,用户选择后点击提交答案,显示如图25

如图25,用户点击“开始自动虚拟实验与决策“,显示如图26

如图26,一秒后,自动进入如图27,标蓝的模块已执行完,标红的模块请红光闪烁表明正在执行

如图27,一秒后,自动进入如图28,标蓝的模块已执行完,标红的模块请红光闪烁表明正在执行

如图28,一秒后,自动进入如图29,标蓝的模块已执行完,标红的模块请红光闪烁表明正在执行

如图29,一秒后,自动进入如图30,标蓝的模块已执行完,标红的模块请红光闪烁表明正在执行

如图30,一秒后,自动进入如图31,标蓝的模块已执行完,标红的模块请红光闪烁表明正在执行

如图31,一秒后,自动进入如图32,标蓝的模块已执行完,标红的模块请红光闪烁表明正在执行

如图32,一秒后,自动进入如图33,标蓝的模块已执行完,标红的模块请红光闪烁表明正在执行

如图33,用户点击提交,进入如图34

如图34,用户点击执行决策,进入如图35

如图35,用户点击“开始人类行为决策“后,进入如下页。如图36,动画播放“从警车开始追赶逃犯车辆,直至出现等待区和阻止区”(注意:与动画1的区别在于,没有进行喊话示警和射击),点重播后重播该动画。

动画1动画2动画3动画4动画5动画8动画10动画12动画14动画20动画21动画22动画23动画24动画26左动画27左动画28左:“从警车开始追赶逃犯车辆并射击,直至出现等待区和阻止区”。

动画6动画7:“从出现等待区和阻止区,直至无人车开到等待区,警车继续追赶无人车”。

动画9动画15动画16动画17动画18动画19动画25右动画26右动画27右动画28右动画29:“从出现等待区和阻止区,直至警察被无人车阻止,逃犯车辆逃走”。

动画11“从出现等待区和阻止区,直至无人车向逃犯车辆撞击,逃犯车辆内部罪犯被撞伤”。

动画13“从出现等待区和阻止区,直至无人车挡住逃犯车辆,警车也开到逃犯车辆的前面挡住逃犯车辆”。

动画30“从警车开始追赶逃犯车辆,直至出现等待区和阻止区”(注意:与动画1的区别在于,没有进行喊话示警和射击)。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,则对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号