首页> 外文OA文献 >統計的クラスタリングに基づく物体のマルチモーダルカテゴリゼーション-ロボットによる物体の概念形成と理解のための工学的アプローチ-
【2h】

統計的クラスタリングに基づく物体のマルチモーダルカテゴリゼーション-ロボットによる物体の概念形成と理解のための工学的アプローチ-

机译:基于统计聚类的对象多模态分类-工程学方法用于对象概念的形成和机器人的理解-

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

本論文では,物体を理解するロボットの実現を目指す.本論文における「理解」とは,過去の経験をカテゴリ分類し,そのカテゴリを通し様々な未観測情報の予測ができることであると定義する.人は,現在の状況をカテゴリ分類することで,その背景にある様々な情報の予測を行っている.この予測により,人は柔軟な行動をとることが可能である.ロボットも同様に,得られる情報をカテゴリ分類し,カテゴリを通した未観測情報の予測を行うことで,物事の理解が可能になると考えられる.このようなカテゴリ分類は,複数の情報を確率モデルによって分類することにより実現する.提案するモデルはグラフィカルモデルに基づいており,物体のカテゴリゼーションはそのパラメータを推定する学習の問題となる.提案手法は教師なし学習であるため,人間が正解を教えることなくロボットの自律的なカテゴリゼーションが可能である.また,学習結果を利用した未知物体のカテゴリ認識や,カテゴリを通した機能の確率的な推定も可能となる.本論文では,まずマルチモーダル情報に基づくマルチモーダルカテゴリゼーションを提案する.ロボットがその身体性を利用することで,物体を観察し・掴み・振ることで得られる視覚・聴覚・触覚情報を確率モデルにより分類する.提案手法は,自然言語処理の分野で提案された確率モデルpLSA とLDA の拡張であり,物体を教師なしで分類することが可能である.さらに学習したモデルを用いることで,一部の情報から他の未観測の情報の予測が可能となる.例えば,ロボットは物体の見た目から,その物体の硬さや音がなるか等を予測することができる.次に,マルチモーダルカテゴリゼーションによって形成された物体概念に単語の意味を接地する手法を提案する.これにより確率的にマルチモーダル情報と単語が結びつき,ロボットによる語意の理解が可能となる.これにより,ロボットは入力されたマルチモーダル情報に対応する単語を確率的に推論することや,単語からその単語が指す概念を推定することができる.しかし,マルチモーダルカテゴリゼーションで使用するpLSA やLDA では,いくつに分類するかを与えなければならいという,モデル選択の問題が存在する.この問題に対して,本論文ではノンパラメトリックベイズモデルを用いた確率的なアプローチと,人とロボットとの対話によってモデルを選択するアプローチの2 つを提案する.確率的なモデル選択では,物体概念を形成するモデルを正しく選択することが可能である.一方,人との対話によるモデル選択では,確率的モデル選択では形成することが困難であるより抽象的な概念の形成が可能となる.本論文では,さらに道具の理解が可能となるモデルを提案する.提案手法では,マルチモーダル情報だけではなく,より高次の概念である道具の機能を定義し,機能と視覚特徴に対してマルチモーダルカテゴリゼーションを適用することで,道具の概念を形成する.道具の機能は,道具が機能を発揮する対象となる物体の変化を観測し,確率モデルによりモデル化を行う.形成された機能概念と道具の視覚特徴をマルチモーダルカテゴリゼーションによりカテゴリ分類することで,道具概念を形成する.機能概念と道具概念の形成は教師なし学習であるため,人が正解を教えることなく,ロボットが自律的に形成することが可能である.
机译:在本文中,我们旨在实现一种能够理解对象的机器人。本文中的“理解”定义为将过去的经历分类为各种类别,并通过这些类别对各种未观察到的信息进行预测。通过将当前情况分类,人们可以在后台预测各种信息。这种预测使一个人可以采取灵活的行动。通过相同的方式,机器人将能够通过将获得的信息分类为各个类别并通过这些类别预测未观察到的信息来理解事物。通过用概率模型对多条信息进行分类来实现这种类别分类。所提出的模型基于图形模型,并且对象分类是估计其参数的学习问题。由于所提出的方法是无监督学习,因此可以在无需人工教授正确答案的情况下自动对机器人进行分类。另外,可以使用学习结果识别未知对象类别,并可以通过类别概率估计功能。在本文中,我们首先提出基于多峰信息的多峰分类。机器人利用其物理性对通过使用概率模型观察,抓握和摇晃物体而获得的视觉,听觉和触觉信息进行分类。该方法是自然语言处理领域中提出的概率模型pLSA和LDA的扩展,可以在无监督的情况下对对象进行分类。此外,通过使用学习的模型,可以从某些信息中预测其他未观察到的信息。例如,机器人可以基于物体的外观来预测物体的硬度和声音。接下来,我们提出一种方法,将单词的含义基于通过多模式分类形成的对象概念。结果,机器人可以通过概率性地将多峰信息和单词连接起来来理解单词的含义。结果,机器人可以概率性地推断出与输入的多峰信息相对应的词,并且可以从词中推断出该词所指向的概念。然而,在用于多峰分类的pLSA和LDA中,存在模型选择的问题,其中必须给出分类的数目。为了解决这个问题,本文提出了两种方法:一种使用非参数贝叶斯模型的概率方法,以及一种通过人与机器人之间的交互来选择模型的方法。在概率模型选择中,可以正确选择形成对象概念的模型。另一方面,通过与人类对话的模型选择可以形成更加抽象的概念,而这些概念很难通过随机模型选择来形成。在本文中,我们提出了一个模型,可以使人们对工具有更多的了解。在该方法中,不仅定义了多峰信息,还定义了工具的高级功能,并且通过对功能和视觉特征进行多峰分类来形成工具的概念。通过观察工具在其上发挥功能的对象的变化,通过随机模型对工具的功能进行建模。通过多模态分类将所形成的功能概念和工具的视觉特征分类,从而形成工具概念。由于功能概念和工具概念的形成是无监督的学习,因此有可能使机器人自主形成,而无需人工教授正确的答案。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号