TEMA 0 INTRODUCCIÓN A LA VISIÓN ARTIFICIAL
QUÉ ES LA VISIÓN ARTIFICIAL (V.A.)? La V.A. consiste en... el proceso de obtención, caracterización e interpretación de la información a partir de imágenes. La visión es... un proceso de tratamiento de información que permite obtener una descripción simbólica del mundo real a partir de imágenes. Se estima que aproximadamente las ¾ partes de la información que maneja el ser humano es visual, parece lógico pensar que el objetivo de dotar a las máquinas del sentido de la vista supondrá un salto cualitativo en sus capacidades de actuación. La visión artificial en último término tiene como finalidad la reproducción del sentido de la vista. Se trata de un objetivo ambicioso y complejo que se encuentra actualmente en una etapa todavía primitiva. La visión parece... fácil pero es ciertamente difícil Una definición más acorde con su estado de desarrollo actual sería: La visión artificial es la ciencia que estudia, utilizando computadores digitales, los procesos de obtención, caracterización e interpretación de la información procedentes de imágenes tomadas de un mundo tridimensional. INTRODUCCIÓN A LA V.A. 2
NECESIDAD DE VER "ARTIFICIALMENTE" Al igual que le sucede al hombre, el sentido de la vista es de gran importancia para las máquinas. Las máquinas necesitan "ver" para realizar operaciones análogas (ensamblar, moverse, inspeccionar, etc) a las que efectúan los humanos. E1 sentido de la vista es capaz de permitir a las máquinas adquirir información y aprender de su entorno INTRODUCCIÓN A LA V.A. 3
VISIÓN HUMANA El sistema visual humano permite reconocer objetos, incluso complejos, en fracciones de segundo. Se estima que aproximadamente el 60% de la corteza cerebral se dedica a tratar información visual. Podría hacerse una analogía fácil entre un sistema de V.A. y el sistema visual humano. Los ojos o, mejor dicho, el ojo (pues la mayoría de los equipos actuales son tuertos) sería la cámara y el computador que realiza el procesamiento, el cerebro. o La información visual que percibimos está compuesta por radiaciones de diferentes longitudes de onda λ. o El ojo humano percibe un rango de λ conocido como ESPECTRO VISIBLE. Su máxima sensibilidad se da en λ=560nm ( color amarillo-verdoso ) ultravioleta espectro visible infrarrojos 350 750 LONGITUD DE ONDA (nm) Rojo = 700nm Verde = 546 nm Azul = 435 nm INTRODUCCIÓN A LA V.A. 4
o La información visual es captada por el ojo a través de una membrana nerviosa que recibe el nombre de retina. Sección del ojo o Cada punto de la escena pasa a través del centro óptico C de la lente (cristalino) y se proyecta en un punto de la retina. Formación de la imagen en la retina INTRODUCCIÓN A LA V.A. 5
o La parte externa de la retina está formada por dos tipos de células : Conos (cones): responsables de la captación del color Bastoncillos (roods): responsables de la captación de las imágenes en blanco y negro. (bastoncillos) (conos) Conos y bastoncillos (punto ciego) Distribución de conos y bastoncillos sobre la retina INTRODUCCIÓN A LA V.A. 6
o La sensibilidad espectral de la visión humana depende de la iluminación de la escena. Las curvas de " función de luminosidad" representan la sensibilidad espectral de la visión humana a una radiación óptica en función de la longitud de onda. Función de visibilidad photopic (fotópica): Representa la sensibilidad espectral ante niveles altos de iluminación (conos fundamentalmente y bastoncillos). Función de visibilidad Scotopic (escotópica) : Representa la sensibilidad espectral ante niveles bajos de iluminación (visión nocturna) (bastoncillos). Funciones de sensibilidad del ojo o Esta información es preprocesada en diferentes capas de la propia retina y mandada al cerebro a través del nervio óptico donde será definitivamente procesada (10 11 neuronas y 10 14 interconexiones). iii Los S.V.A. tienen un largo y difícil camino por delante, antes de llegar a resultados comparables a los de la visión humana!!! INTRODUCCIÓN A LA V.A. 7
DIFICULTADES DE LA V.A. La visión es un proceso realmente complejo aunque para nosotros es más bien fácil ya que no somos conscientes de ello. Las imágenes son ambiguas (proyección 3D a 2D, Problemas de localización) Las imágenes aglutinan multitud de factores (iluminación, forma de los objetos, color y textura de las superficies, parámetros y distorsiones de la cámara, etc) Varios conocimientos inter-relacionados (localización, reconocimiento) Gran cantidad de información a tratar (gran potencia de cálculo) Las técnicas poseen un elevado carácter experimental, aunque cada vez van teniendo una mayor formalización matemática. INTRODUCCIÓN A LA V.A. 8
HITOS HISTÓRICOS - Fotografía aérea (mediados del s. XIX): cartografía - 1920: se utilizaba para el levantamiento de planos - Años 50: la fotografía en color (ya muy perfeccionada), los barredores multiespectrales y el radar, abrieron nuevas zonas del espectro electromagnético para su uso en prospección. - 1960: en satélites para el estudio de recursos naturales, cartografía, variables meteorológicas, etc. - 1980: guiado de robots, manipulación, control de calidad - 1997: Interpretación de imágenes obtenidas de otros planetas y galaxias. - 2000: imágenes en teléfonos móviles, videoconferencias, sistemas de vigilancia, de control de acceso... INTRODUCCIÓN A LA V.A. 9
OBJETIVOS DE LA V.A. Preprocesamiento de la imagen (Image processing). Mejora de la calidad de la imagen. Segmentación: División de la imagen en partes (segmentos) con características semejantes. Representación y descripción (de cada parte o segmento de la imagen como un vector de características) Reconocimiento de formas (Pattern Recognition). Interpretación de imagen (Image understanding) INTRODUCCIÓN A LA V.A. 10
PREPROCESAMIENTO DE LA IMAGEN (IMAGE PROCESING) INTRODUCCIÓN A LA V.A. 11
PREPROCESAMIENTO DE LA IMAGEN (IMAGE PROCESING) INTRODUCCIÓN A LA V.A. 12
RECONOCIMIENTO DE FORMA (PATTERN RECOGNITION) INTRODUCCIÓN A LA V.A. 13
INTERPRETACIÓN DE LA IMAGEN (IMAGE UNDERSTANDING) INTRODUCCIÓN A LA V.A. 14
APLICACIONES - Industriales (clasificación, control de calidad, brazos robots, etc) - Medicina (Análisis de enfermedades, operaciones con endoscopios, etc) - Teledetección (Satélites) - Robótica (Guiado de robots móviles) - Tratamiento de documentos (reconstrucción y almacenamiento de información) - Temas de seguridad - Redes de comunicación (Compresión de señal de video, Teleconferencias, etc) - Realidad virtual (Creación de entornos 3D) INTRODUCCIÓN A LA V.A. 15
APLICACIONES DE LA V. A. 1.- Análisis de imágenes médicas 2.- Interpretación de fotografía aérea 3.-Exploración y movilidad INTRODUCCIÓN A LA V.A. 16
APLICACIONES DE LA V. A. 4.- Manejo de materiales 5.- Inspección 6.- Ensamblaje 7.- Navegación INTRODUCCIÓN A LA V.A. 17