首页> 外文OA文献 >Multi-modal pedestrian detection
【2h】

Multi-modal pedestrian detection

机译:多模式行人检测

摘要

La detección de peatones continua siendo un problema muy difícil en escenarios reales, donde diferentes situaciones como cambios en iluminación, imágenes ruidosas, objetos inesperados, escenarios sin control y la variabilidad en la apariencia de los objetos ocurren constantemente. Todos estos problemas fuerzan el desarrollo de detectores más robustos para aplicaciones relevantes como lo son los vehículos autónomos basados en visión, vigilancia inteligente y el seguimiento de peatones para el análisis del comportamiento. Los detectores de peatones basados en visión más confiables deciden basándose en descriptores extraídos usando un único sensor y capturando características complementarias, e.g., apariencia y textura. Estas características son extraídas de una única imagen, ignorando la información temporal, o incluyendo esta información en un paso de post procesamiento e.g., seguimiento o coherencia temporal. Teniendo en cuenta estos hechos, nos formulamos la siguiente pregunta: ¿Podemos generar detectores de peatones más robustos mediante la introducción de nuevas fuentes de información en el paso de extracción de características? Para responder a esta pregunta desarrollamos diferentes propuestas para introducir nuevas fuentes de información a detectores de peatones bien conocidos. Empezamos por la inclusión de información temporal siguiendo el paradigma del aprendizaje secuencial apilado (SSL siglas en inglés), el cual sugiere que la información extraída de las muestras vecinas en una secuencia pueden mejorar la exactitud de un clasificador base. Después nos enfocamos en la inclusión de información complementaria proveniente de sensores diferentes como nubes de puntos 3D (LIDAR - profundidad), imágenes infrarrojas (FIR) o mapas de disparidad (par estéreo de cámaras). Para tal fin desarrollamos un marco multimodal en el cual información proveniente de diferentes sensores es usada para incrementar la exactitud en la detección (aumentando la redundancia de la información). Finalmente proponemos un detector multi-vista, esta propuesta multi-vista divide el problema de detección en n sub-problemas. Cada uno de estos sub-problemas detectara objetos en una vista específica dada, reduciendo así el problema de la variabilidad que se tiene cuando un único detector es usado para todo el problema. Demostramos que estas propuestas obtienen resultados competitivos con otros métodos en el estado del arte, pero envés de diseñar nuevas características, reutilizamos las existentes para mejorar el desempeño.
机译:在真实场景中,行人检测仍然是一个非常困难的问题,在该场景中,不断发生诸如照明变化,噪点图像,意外对象,不受控制的场景以及对象外观变化之类的不同情况。所有这些问题迫使针对相关应用(例如基于视觉的自动驾驶汽车,智能监控以及用于行为分析的行人跟踪)开发更强大的检测器。最可靠的基于视觉的行人检测器基于使用单个传感器提取的描述符进行决策,并捕获互补的特征(例如外观和纹理)。这些特征是从单个图像中提取的,忽略了时间信息,或者在后处理步骤(例如跟踪或时间相干性)中包括了该信息。考虑到这些事实,我们向自己提出以下问题:是否可以通过在特征提取步骤中引入新的信息源来生成更强大的行人检测器?为了回答这个问题,我们提出了不同的建议,将新的信息来源引入到著名的行人探测器中。我们首先在堆叠顺序学习(SSL)范式之后包含时间信息,这表明从序列中的相邻样本中提取的信息可以提高基本分类器的准确性。然后,我们专注于包含来自不同传感器的补充信息,例如3D点云(LIDAR-深度),红外图像(FIR)或视差图(立体相机对)。为此,我们开发了一种多模式框架,其中使用来自不同传感器的信息来提高检测精度(增加信息的冗余度)。最后,我们提出了一种多视点检测器,该多视点检测器将检测问题分为n个子问题。这些子问题中的每一个都会在给定的特定视图中检测对象,从而减少了在将单个检测器用于整个问题时发生的可变性问题。我们证明了这些提议与现有技术中的其他方法相比具有竞争优势,但是我们没有设计新功能,而是重用了现有功能以提高性能。

著录项

  • 作者

    González Alzate Alejandro;

  • 作者单位
  • 年度 2015
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号