要解决的问题:使机器人进行的动作不会使用户觉得娱乐机器人感到无聊,并使机器人学习自己执行的动作。解决方案:动作选择控制系统100具有:多个元素动作,当被选择时输出动作;动作值计算部分120,该动作值计算部分120参考数据库,在该数据库中要输入的外部刺激对应于在进行该动作之后预期改变的预期内部条件变化,并且计算每个元素的动作值AL基于来自内部条件控制部分91和外部刺激识别部分80的信息的动作;动作选择部分130选择具有最大动作值AL的元素动作;学习部分140,其在执行动作之后基于结果来更新数据库。使预定的内部条件和外部刺激对应于每个动作。动作值计算部120基于与所输入的内部条件相对应的动作的期望值以及基于期望内部条件变化的期望满意度水平变化,来计算每个动作的动作值AL。
版权:(C)2005,JPO&NCIPI