Técnicas de autolocalización en 3D con visión monocular

Documentos relacionados
ESTIMACIÓN N DE LA DISTANCIA RECORRIDA POR UN ROBOT MÓVIL M MEDIANTE LA UTILIZACIÓN N DE DESCRIPTORES SURF

LOCALIZACIÓN Y MAPEO SIMULTÁNEO EN TIEMPO REAL, EMPLEANDO UNA CÁMARA MONOCULAR

Técnicas de optimización en visión artificial

Localización. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

Introducción a la Realidad Aumentada (parte II) Jairo R. Sánchez Tapia

4.1 Introducción al filtrado adaptativo

Sistema de apoyo al repostaje en vuelo basado en Visión artificial

Reconstrucción 3D: Estéreo

Trabajo Fin de Carrera

PERCEPCIÓN AVANZADA MASTER EN Automática, Robótica y Telemática

Introducción teórica del filtro de Kalman. a) el conocimiento del sistema y a dispositivos dinámicos de medida,

Contenido Capítulo 1 Introducción Capítulo 2 Conceptos Básicos Capítulo 3 Procesamiento de Imágenes en el Dominio Espacial

Visión artificial y Robótica. Depto. de Ciencia de la Computación e Inteligencia Artificial

Reconstrucción tridimensional de vasos sanguíneos de retina de humanos

VISIÓN 3D. José M. Sebastián - Luis M. Jiménez. Problema Central de la Visión Artificial Tridimensional.

Localización Simultánea a la Reconstrucción de Robots Móviles en Espacios Inteligentes mediante Múltiples Cámaras

Revisado por: Director: Ing. Eddie Galarza. Realizado por: Luis Ernesto Caiza Andrango

Visión. Sesión 3: Clasificación de imágenes mediante histogramas y características. Departamento CCIA

Estéreo dinámico. Estéreo dinámico

RECONSTRUCCIÓN TRIDIMENSIONAL DE ZONAS DE INTERÉS: EVALUACIÓN DE RGB-D SLAM

VISIÓN POR COMPUTADOR

Seguimiento de Objetos en Secuencias de Imágenes. Juan J. Pantrigo

Universidad Pontificia Bolivariana. Escuela de Ingenierías. Centro Ciencia Básica

SLAM VISUAL: Navegación Robótica a partir de Imágenes

Capítulo 2 Métodos de localización.

Localización local y global integrando información visual y de rango para robots móviles en ambientes no estacionarios. Josué Sánchez Texis

DESCRIPCIÓN DEL RESULTADO DE INVESTIGACIÓN

Doctorado en Tecnologías de las Comunicaciones - Procesado Digital de Señales en Comunicaciones (Curso 2003/04)

Visión 3D en robots móviles

Algoritmos de visión para plataformas mini-humanoide de competición con capacidades aumentadas

LIM. Integración mediante filtro de Kalman de sensores inerciales y GPS para la estimación de la posición de un vehículo. Trabajo fin de Grado

Trabajo Fin de Grado. Evaluación de ORBSLAM en Secuencias de Endoscopia Médica

Percepción visual aplicada a la robótica

Técnicas de análisis y evaluación de procesos de reconstrucción 3D en el ámbito de la localización por visión

= v. = v. Restricciones geométricas. Restricciones geométricas. Restricciones geométricas. Restricciones de consistencia. m 1 m 2.

Trabajo Fin de Grado. Estudio de técnica de generación de modelos 3D a partir de secuencias de imágenes

Capítulo 1 Introducción.

Grado en Ingeniería Informática Proyecto Fin de Grado. Autor: Juan Carlos Ortega Pérez Directores: Sergio Escalera y Miguel Ángel Bautista

6DOF LOCALIZACIÓN Y MAPEADO SIMULTÁNEO (SLAM) EN TIEMPO REAL MEDIANTE CÁMARA ESTÉREO MOVIDA CON LA MANO

Estéreo estático. Derivadas segundas obtenidas en direcciones distintas sobre el mismo borde

[20380] Visió per Computador Prueba 2 (2016) [A] Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)

Seguimiento y relocalización de una cámara monocular en mapas densos tridimensionales.

Tesis de Máster. Alejandro Legrá Rios. Directores: Javier Macías Guarasa & Daniel Pizarro Pérez

RECONOCIMIENTO DE RUTAS DE ESCALADA EN PAREDES DE PIEDRA

Estudio del estado del arte del SLAM e implementación de una plataforma exible

A L G O R I T M O S D E M A P E A D O 3 D. 5.1 introducción

Planificaciones Seminario de Electrónica II. Docente responsable: MAS IGNACIO AGUSTÍN. 1 de 5

Detección y cierre de ciclos en sistemas SLAM basados en visión estéreo

PFC: Localización de robots mediante filtro de Kalman

Reconocimiento visual de ademanes usando MS Kinect - Introducción. Dr. Héctor Avilés Escuela de Invierno de Robótica 2015

Posicionamiento indoor con señales de WiFi

Grupo de Procesamiento de Imágenes y Visión por Computadora

Trabajo Fin de Máster Máster en Ingeniería Industrial

Odometría Visual para Robots Móviles Utilizando Smartphones como Unidad de Sensado y Procesamiento

Figura 1: Propiedades de textura: (a) Suavidad, (b) Rugosidad y (c) Regularidad

Identificación n de SIStemas

Animación 3D por Computador I

Estratigrafía Series de tiempo Tomogramas Descripción del gasto sólido de fondo

DESCRIPCIÓN DEL RESULTADO DE INVESTIGACIÓN

Filtro de Partículas Luca Martino Juan Santaella Vallejo Tratamiento Digital de Señales Master Interuniversitario en Comunicaciones y Multimedia

Visión de Alto Nivel. Dr. Luis Enrique Sucar INAOE. ccc.inaoep.mx/~esucar Sesión 5 Representación y Reconocimiento

DIPLOMADO INTELIGENCIA ARTIFICIAL con Aplicación en Robots Móviles FACULTAD DE INGENIERÍA 2018

Francisco J. Hernández López

Toma de datos con el brazo robotizado

Desayuno Tecnológico: Tendencias y Herramientas de Video Inteligente en Seguridad Física

Reconocimiento de objetos en escenas complejas para aplicaciones de realidad aumentada

ANEXO N 4. Algoritmo de Flujo Óptico

Sistema para captura y procesamiento de video y fotografia aerea para drones y aviones ligeros

Técnicas de inteligencia artificial. Visión Artificial Extracción de características

Ver para aprender y. Eduardo Morales, Hugo Jair Escalante

UNIVERSIDAD DEL VALLE DE MÉXICO PROGRAMA DE ESTUDIO DE LICENCIATURA PRAXIS MES XXI

Dinámica del Robot. UCR ECCI CI-2657 Robótica Prof. M.Sc. Kryscia Daviana Ramírez Benavides

Integración con Rhino V-Ray para Rhino 1.5 compatible con la versión de 32 bits de Rhino 4.0 y las versiones de 32 y 64 bits de Rhino 5.0.

4 Localización de terremotos

Tema 5. Detección de bordes

Morfometría Geométrica

Smartphones como Unidad de Sensado y Procesamiento para la Localización de Robots Móviles Utilizando Odometría Visual Monocular

Reconstrucción Tridimensional a Partir de Varias Imágenes

Introducción a las wavelets y sus aplicaciones al procesamiento de imágenes

1. Sistemas Lineales e Invariantes a la Traslación 1.1 Motivación de las imágenes digitales Qué es una imagen digital? Sistema: Suma: Escalamiento:

MASTER UNIVERSITARIO EN ROBÓTICA

UN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS

Robótica y visión artificial. Miguel Cazorla Grupo de Visión Robótica Universidad de Alicante

Sistema de ecuaciones lineales

Obtención de modelos tridimensionales para ingeniería por medio de barredores lídar y de aeronaves no tripuladas

Análisis del artículo

PRÓLOGO PREFACIO... 21

4 Localización de terremotos

Sistema de Realidad Aumentada en Entornos Reales Adversos

Mapeo. CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

4.3. Evaluación Se ha escogido un problema de seguimiento de un sólo objeto para evitar el proceso de asociación de datos y facilitar la visual

Reconocimiento automático de palabras en documentos históricos usando redes neuronales convolucionales

6 Analizador de escena

ROBOTICA por OLLERO BATURONE Editorial Marcombo. Foreword Prólogo Prefacio del autor

TESIS MASTER EN INGENIERÍA UNIVERSIDAD DEL VALLE PROGRAMA DE POSGRADO EN INGENIERÍA ELÉCTRICA Y ELECTRÓNICA FACULTAD DE INGENIERÍA

[20380] Visió per Computador Prueba 1 (2017) [A] Teoría (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)

Seguimiento i de objetos

Sistemas de guiado para colaboración en navegación de vehículos autónomos ( AGV )

IMPLEMENTACION DE ODOMETRÍA VISUAL UTILIZANDO UNA CAMARA ESTEREOSCÓPICA MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL ELÉCTRICO

Transcripción:

Técnicas de autolocalización en 3D con visión monocular Eduardo Perdices eperdices@gsyc.es Universidad Rey Juan Carlos 05 Abril 2016

Contenidos 1 Contenidos Introducción MonoSLAM PTAM SVO Futuro Próximo

Introducción 2 Introducción Visión Artificial: campo de la informática que estudia el uso de cámaras Bajo coste Permite extraer mucha información Procesamiento muy costoso Detección de bordes, features, texturas... Reconocimiento de formas, caras...

Introducción 3 Aplicaciones Medicina OCR Biometría Ojo de halcón (tenis) MediaPro: distancia recorrida por un futbolista

Introducción 4 Autolocalización con cámaras Visión monocular Cámaras estéreo: Bumblebee Cámaras RGBD: Kinect, Xtion, Kinect2 Requisitos: tiempo real, robustez

Introducción 5 Aplicaciones de la autolocalización Navegación Mapas, reconstrucción 3D Realidad aumentada Transporte Vigilancia Vehículos autónomos

Extracción de información 6 Extracción de información Modelo Pin-Hole Parámetros intrínsecos Distancia focal Centro óptico Skew (distorsión...) Parámetros extrínsecos: posición y orientación Permite sacar información espacial

Extracción de información 7 Detección de puntos Puntos con rica información local a su alrededor Deben ser repetibles e invariantes a escala y orientación Múltiples algoritmos de detección (SIFT, SURF, FAST, ORB) FAST: Destaca por su rapidez, muy utilizado para tiempo real

Extracción de información 8 Matching Utilizando descriptores (SIFT, SURF, ORB) Mediante comparación de parches: Diferencia de píxeles Color medio, conteo de colores, etc Suma de diferencias cuadráticas (SSD, ZSSD, etc)

MonoSLAM 9 MonoSLAM Siglas de Simultaneous Localization and Mapping Objetivos: Localización precisa de robots/cámaras en 3D Generación dinámica de mapas en 3D Funcionamiento en tiempo real (30FPS) Manejo de hasta 30-100 puntos por iteración

MonoSLAM 10 Filtro de Kalman Estimación de estados basado en observaciones Sistemas lineales (KF) o no lineales (EKF) Vector de estados en MonoSLAM: Cámara: Posición, orientación, velocidad lineal y angular Para cada punto: Posición en 3D

MonoSLAM 11 Primera aproximación: Partiendo de puntos conocidos Arranque con al menos 4 puntos conocidos en 3D Detección de puntos con FAST Matching entre parches (11x11) Área de búsqueda depende de incertidumbre

MonoSLAM 12 Primera aproximación: Inicialización de puntos Se necesita desplazamiento de la cámara y varias observaciones Inicialización de una ĺınea en 3D con profundidad desconocida Sólo se inicializan puntos cercanos a los actuales Distribución de N partículas a lo largo de la ĺınea en 3D Se inserta el punto en el EKF sólo cuando haya poca incertidumbre

MonoSLAM 13

MonoSLAM 14 Puntos en el infinito: Inverse Depth Parametrization No necesita partir de puntos conocidos Pueden inicializarse puntos cercanos o lejanos (infinito) Puntos dentro del EKF desde su inicialización (mejora orientación) Problema: El mapa generado depende de la escala

MonoSLAM 15 Otras técnicas One-point RANSAC Active matching Búsqueda de estructuras de puntos Puntos dinámicos

PTAM 16 PTAM Siglas de Parallel Tracking and Mapping División del algoritmo en dos hilos (tracking y mapping) Tracking en tiempo real (30FPS) Mapas optimizados mediante Bundle Adjustment Cálculo de hasta 1000 puntos por iteración Permite relocalización

PTAM 17 Inicialización por Homografía Homografía: Relaciona pares de puntos coplanares entre dos imágenes Permita obtener rotación y traslación a partir de H Obtención de puntos 3D por triangulación (dependientes de escala) Selección de puntos coplanares utilizando RANSAC x x x y = 1 x = Hx h 11 h 12 h 13 x x h 21 h 22 h 23 x y h 31 h 32 h 33 1

PTAM 18 Tracking Calcula la posición, orientación y velocidades de la cámara Detección de puntos con FAST y matching entre parches (8x8) Área de búsqueda fijo Pasos del algoritmo: Predicción de posición actual con modelo de movimiento Búsqueda de grano grueso (50 puntos) y grano fino (1000 puntos) Actualización de posición mediante Gauss-Newton Comprueba la calidad del tracking y si necesita relocalizarse

PTAM 19 Creación de nuevos puntos Se guardan determinados frames en memoria (KeyFrames) Se obtienen nuevos puntos triangulando entre KeyFrames

PTAM 20 Mapping Almacena puntos 3D (miles) y KeyFrames (cientos) No necesita funcionar en tiempo real Optimización de posiciones mediante Bundle Adjustment: Minimiza el error de reproyección entre puntos y frames

PTAM 21 Mejoras de PTAM vs MonoSLAM Maneja más puntos ( 100 veces más) La localización es más precisa El mapa generado es más realista Relocalización

SVO 22 SVO Siglas de Semi-Direct Monocular Visual Odometry Objetivo: Tiempo real usando procesadores poco potentes

SVO 23 Características Similitudes con PTAM: División del algoritmo en dos hilos (tracking y mapping) Inicialización mediante homografía Permite relocalización Diferencias con PTAM: Tracking con métodos directos Creación de puntos mediante profundidad inversa Tracking mucho más eficiente ( 100FPS) Autolocalización más precisa

SVO 24 Tracking Método directo para estimar desplazamiento: Minimiza la diferencia de intensidad entre dos imágenes Uso de imagen completa o de puntos destacados Ideal para imágenes con poca textura o borrosas Aumento de precisión con matching de puntos: Pocos puntos (120-150) distribuidos en la imagen Regiones muy pequeñas

SVO 25 Inicialización de puntos Puntos en el infinito: Inverse Depth Parametrization Profundidad actualizada fusionando densidades de probabilidad Sólo se añaden al mapa los puntos que convergen

SVO 26 Mapping Funcionamiento similar a PTAM Guarda puntos 3D y KeyFrames Pocos outliers Mapa menos denso pero más fiable Posibilidad de utilizar Bundle Adjustment

SVO 27 Mejoras de SVO vs PTAM Menor coste computacional Mayor precisión Puntos más fiables (pero menos puntos) Funciona en entornos con poca textura

Futuro próximo 28 Futuro próximo Realidad aumentada en móviles Modelado 3D Aplicaciones médicas Vehículos autónomos Hologramas

Futuro próximo (cont.) 29

Técnicas de autolocalización en 3D con visión monocular Eduardo Perdices eperdices@gsyc.es Universidad Rey Juan Carlos 05 Abril 2016