首页> 外文期刊>電子情報通信学会技術研究報告 >First Person Vision のためのInside-Outカメラの提案
【24h】

First Person Vision のためのInside-Outカメラの提案

机译:用于第一人称视觉的内外摄像头的建议

获取原文
获取原文并翻译 | 示例
       

摘要

First Person Vision, which attempts to understand a person's behavioral intention, requires information on the person's state and on what the person is looking at. We propose an inside-out camera that simultaneously obtains image of one of the person's eyeballs and image of that person's visual field, and propose a method for estimating the person's gaze point based on the configuration of the camera. The inside-out camera uses a half mirror to capture the eyeball from the front and the person's visual field from the same position as the eyeball. The relationship between the gaze vector obtained from the eyeball video and the gaze point obtained from the scene video is expressed by a conversion equation, and the gaze point is estimated from the gaze vector by estimating beforehand the parameters of this conversion equation. In an evaluation experiment, we took scene video for both eyes when gazing at a certain landmark as evaluation data, and calculated the error between the position of the landmark in the scene video as the true value and the gaze point estimated from the gaze vector. It was found that the gaze point could be estimated with an average error of about 15 pixels.%人の行動意図を認識しようとするFirst Person Visionでは,人の状態とその人が何を見ているのかという情報が必要となる.そこで我々は,人の眼球と人の視界映像を同時に取得するInside-Outカメラを提案し,そのカメラの構成を生かした注視点の推定法も提案する.Imide-Outカメラはハーフミラーを介して眼球を正面から,視界映像を眼球と同等の位置から撮影することができる.Inside-Outカメラでは.眼球を撮影した画像から得られる視線ベクトルと視界を撮影した画像から得られる注視点位置の関係を変換式で表すことが可能である.そのため,変換式のパラメータをあらかじめ推定することにより.視線ベクトルから注視点を推定する.評価実験では.ランドマークを注視した際の両眼,両視界映像を撮影し,視界画像のランドマーク位置を真備として視線ベクトルから推定された注視点との誤差を算出した.その結果より,約15pixelの平均誤差で注視点を推定可能であることを確認した.
机译:试图理解一个人的行为意图的第一人称视野需要有关该人的状态和该人正在看什么的信息。我们提出了一种由内而外的摄像头,该摄像头可以同时获取该人的眼球之一的图像和该人的视野的图像,并提出一种基于摄像头配置的估计人的凝视点的方法。里里外外的摄像头使用半反射镜从前方捕获眼球,并从与眼球相同的位置捕获人的视野。从眼球视频获得的凝视向量与从场景视频获得的凝视点之间的关系由转换方程表示,并且通过预先估计该转换方程的参数,从凝视向量估计凝视点。在评估实验中,我们以注视某个地标时的双眼场景视频作为评估数据,并计算了场景视频中地标的位置作为真实值与从注视向量估计的注视点之间的误差。发现注视点的平均误差约为15个像素。%人の行动意図を认识しようとするFirst Person Visionでは,人の状态とその人が何を见ているのかという必要となる。そこで我々は,人の眼球と人の视界映像を同时に取得するInside-Outカメラを实施し,そのカメラの构成を生かした注视点の推定法も实施する。Imide-Outカメラはハーフsideラーを介して眼球を正面から,视界映像を眼球と同等の位置から撮影することができる.Inside-Outカメラでは视点位置の关系を変换式で表すことが可能である。そのため,変换式のパラメータをあらかじめ推定することにより。视线ベクトルから注视点を推定する。评価実験では。ランドマークを注视した际の両眼,両视界映像を撮影し,视界画像のランドマーク位置を真备として视线ベクトルから推定された注视点との误差を算出した。その结果より,约15pixelの平均误差で注视点を推定可能であることを确认した。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号