Visión artificial y Robótica. Depto. de Ciencia de la Computación e Inteligencia Artificial

Documentos relacionados
Visión artificial y Robótica Geometría. Depto. de Ciencia de la Computación e Inteligencia Artificial

Visión artificial y Robótica Modelos de movimiento y mapas. Depto. de Ciencia de la Computación e Inteligencia Artificial

Fundamentos Matemáticos de la Ingeniería. Tema 4: Diagonalización de matrices. Curso

Visión por computadora Computer vision

Autovalores y autovectores Diagonalización y formas canónicas

Bloque temático: Sistemas de Reconocimiento de Patrones

Matemáticas I Grado de Administración y Dirección de Empresas Examen de Febrero Curso 2011/ ?

[20380] Visió per Computador Prueba 2 (2013) Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)

Se usa para encontrar un numero relativamente pequeño de variables nuevas que contengan la mayor cantidad de info posible del conjunto de datos

Modelización por medio de sistemas

Tema 11.- Autovalores y Autovectores.

Derivadas Parciales (parte 2)

Técnicas de inteligencia artificial. Visión Artificial Visión 3D

Introducción. Autoencoders. RBMs. Redes de Convolución. Deep Learning. Eduardo Morales INAOE (INAOE) 1 / 60

IA con RARS. Miguel Ángel Herranz Trillo Juan Ramón Martín Blanco. Práctica Final de IRC

CLASIFICACIÓN DE LA IMAGEN. Escuela de Ingeniería Civil y Geomática Francisco Luis Hernández Torres

Robots Autónomos. Depto. de Ciencia de la Computación e Inteligencia Artificial

3.3. Número de condición de una matriz.

Esta expresión polinómica puede expresarse como una expresión matricial de la forma; a 11 a 12 a 1n x 1 x 2 q(x 1, x 2,, x n ) = (x 1, x 2,, x n )

Árboles Filogenéticos. BT7412, CC5702 Bioinformática Diego Arroyuelo. 2 de noviembre de 2010

El pipeline de visualización es el conjunto de

Aprendizaje Automatizado

Algebra lineal de dimensión finita

NORMALES. Computación Gráfica

Análisis de componentes principales. a.k.a.: PCA Principal components analysis

CONCEPTOS BÁSICOS (Freeman capt.1; Neural Nets capt. 4,5 y 7)

Diagonalización de matrices, Semejanza.

Dr. Richard Mercado Rivera 18 de agosto de 2012 Matemática Elemental

1 Representación por superficies de polígonos

SISTEMAS DE ECUACIONES LINEALES. Método de reducción o de Gauss. 1º DE BACHILLERATO DPTO DE MATEMÁTICAS COLEGIO MARAVILLAS AUTORA: Teresa González.

MICROSOFT EXCEL 2010

Esta definición se puede ampliar a cualquier par de bases de los espacio inicial y final MATRIZ DE UNA APLICACIÓN LINEAL EN BASES ARBITRARIAS

UNIVERSIDAD NACIONAL DEL CALLAO

Descomposición en forma canónica de Jordan (Segunda versión)

ÁLGEBRA LINEAL II Algunas soluciones a la práctica 2.3

Formulación del problema de la ruta más corta en programación lineal

Construcción de Gráficas en forma manual y con programados

Introducción a las Redes Neuronales

INGENIERÍA PROFESIONAL EN INOCUIDAD ALIMENTARIA EN COMPETENCIAS PROFESIONALES ASIGNATURA DE ROBÓTICA

Visión. Sesión 3: Clasificación de imágenes mediante histogramas y características. Departamento CCIA

License Plate Detection using Neural Networks

ALGEBRA. Escuela Politécnica Superior de Málaga

Introducción a las RdP. Optimización basada en redes de Petri. Redes de Petri. Son objeto de estudio: RdP. Ejemplos:

3. Espacios de color. 3.Espacios de color. El uso del color en el procesamiento de imágenes está principalmente motivado por dos factores:

Matemáticas UNIDAD 5 CONSIDERACIONES METODOLÓGICAS. Material de apoyo para el docente. Preparado por: Héctor Muñoz

Tema 15: Combinación de clasificadores

GUÍA DOCENTE: Sistemas Basados en Conocimiento y Minería de Datos (SBC)

Materia: Matemática de Octavo Tema: Medidas de tendencia central para datos agrupados Media Aritmética

GRÁFICOS DE CONTROL. Datos tipo atributo

Repaso de conceptos de álgebra lineal

PROBLEMAS TEMA 3: ANÁLISIS DE COMPONENTES PRINCIPALES. LICENCIADO EN ECONOMÍA

TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN

INTRODUCCIÓN DEL TEMA 2 ESPACIOS VECTORIALES

Alcances de una cámara de video seguridad.

Redes bayesianas temporales para reconocimiento de escenarios

Diagonalización de matrices.

Estadística Descriptiva

Matrices, Determinantes y Sistemas Lineales.

Capitulo 4. DECISIONES BAJO RIESGO TEORIA DE JUEGOS

Tema 7: Geometría Analítica. Rectas.

GPU - Procesadores de vértices

CLUSTERING MAPAS AUTOORGANIZATIVOS (KOHONEN) (RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN)

DISEÑO CURRICULAR ALGEBRA LINEAL

Descomposición en valores singulares de una matriz

Espacios Vectoriales. AMD Grado en Ingeniería Informática. AMD Grado en Ingeniería Informática (UM) Espacios Vectoriales 1 / 21

Álgebra Lineal Ma1010

INNOVATE 2016 FORMULARIO PARA LA PRESENTACIÒN DE PROYECTOS DE INVESTIGACIÒN CIENTÍFICO - TECNOLÓGICO. Reconocimiento facial para seguridad biométrica

VISIÓN POR COMPUTADOR

TEMA 11. Autovalores y autovectores. Diagonalización y formas canónicas.

Introducción a los espacios vectoriales

Sistemas de ecuaciones lineales dependientes de un parámetro

Predicción de la relación entre el género, la cantidad de cigarrillos y enfermedades usando Máquinas de Vector Soporte

Pruebas de Acceso a las Universidades de Castilla y León

Medidas de Tendencia Central

Solución de Sistemas de Ecuaciones Diferenciales Lineales

BLOQUE IV. CLASIFICACIÓN

FACULTAD DE INGENIERÍA

INTERFACES INTELIGENTES. ING. MA. MARGARITA LABASTIDA ROLDÁN E mail:

3. ASOCIACIÓN ENTRE DOS VARIABLES CUALITATIVAS

Visión. Sesión 4: Búsqueda y tracking de modelos 2D en imágenes. Departamento CCIA

15. Regresión lineal. Te recomiendo visitar su página de apuntes y vídeos:

Algoritmos. Medios de expresión de un algoritmo. Diagrama de flujo

Una función arroja un valor (y sólo uno) por cada valor que se le introduce. En otras palabras, para cada valor de x, hay un solo valor de y.

3. Selección y Extracción de características. Selección: Extracción: -PCA -NMF

3 Curvas alabeadas. Solución de los ejercicios propuestos.

A continuación se presenta la información de la altura promedio para el año de 1998 en Holanda de hombres y mujeres jóvenes.

PRÁCTICA 8. de Regiones. Grupo de Visión Artificial. David García Pérez

Unidad V. 5.1 Recta tangente y recta normal a una curva en un punto. Curvas ortogonales.

Denotamos a los elementos de la matriz A, de orden m x n, por su localización en la matriz de la

Qué debo saber para realizar la prueba de Lectura?

Inteligencia Artificial. Aprendizaje neuronal. Ing. Sup. en Informática, 4º. Curso académico: 2011/2012 Profesores: Ramón Hermoso y Matteo Vasirani

Curso de Estadística Aplicada a las Ciencias Sociales

Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Estadística Básica COMISIÓN 1. 1 Cuatrimestre 2016

3.2 CONTROL DE GIRO DE UN MOTOR DE INDUCCIÓN DE JAULA DE. Un motor de inducción tiene físicamente el mismo estator de una máquina

Tema 2 Datos multivariantes

Función lineal Ecuación de la recta

Micro y Macroeconomía

MATRICES. Una matriz es un conjunto de números o expresiones dispuestos en forma rectangular, formando filas y columnas.

TEMA 3: FRACCIONES 1º ESO MATEMÁTICAS

Matemáticas financieras

Transcripción:

Visión artificial y Robótica Depto. de Ciencia de la Computación e Inteligencia Artificial

Contenidos Definición y clasificación Reconocimiento basado en la apariencia Bag of words Deep learning Parte de este material procede del Pr. Professor Hager de la Universidad John Hopkins

Definición El reconocimiento de objetos es la tarea de encontrar e identificar un objeto en una imagen o secuencia Los seres vivos somos capaces de reconocer objetos fácilmente, con cambios de escala, rotación, cambio de punto de vista, luminosidad y oclusiones parciales

Qué son objetos? Definición de objeto por la RAE: cosa Cosa: 1. f. Todo lo que tiene entidad, ya sea corporal o espiritual, natural o artificial, real o abstracta. 2. f. Objeto inanimado, por oposición a ser viviente.

Qué involucra el reconocimiento de objetos? Detección: hay coches? Identificación: es una foto de Mao? Categorización de objetos Categorización de escenas y contexto

Reconocimiento de objetos individuales Dada una base de datos de objetos y una imagen, determinar si uno de los objetos está presente en la imagen

Problemas en el reconocimiento Cambios de punto de vista Cambios de iluminación Oclusiones Escala Deformación Fondo complejo

Reconocimiento de objetos Dada una base de datos de objetos conocidos y una imagen: 1.Determinar si un objeto de la BB.DD. está presente en la imagen 2.Determinar la pose (orientación y traslación) del objeto

Evolución 70s: reconocimiento por partes 80s: los objetos se representan con restricciones geométricas con árboles de interpretación y más restricciones geométricas

Evolución 90s: métodos basados en apariencia Basados en análisis de componentes principales

Análisis de componentes principales Reduce la dimensionalidad de los datos de entrada Proyecta los datos de entrada en un subespacio Este subespacio está creado a partir de los autovectores de la matriz de covarianza de los datos de entrada

En qué consiste?

PCA Tenemos un conjunto de entrenamiento: (para el caso de imágenes, hacemos la imagen como un vector de una dimensión) Cada elemento es un vector: Calculamos la media de todo el conjunto de entrenamiento Centramos el conjunto de entrenamiento en el origen restándole la media a cada elemento

Entrenamiento Construimos una BD de imágenes intentando tener la máxima variabilidad y que el fondo no nos afecte

PCA Construimos una matriz donde cada columna es un elemento del conjunto de entrenamiento: Calculamos la matriz de covarianza: (matriz NxN, se obtiene el mismo resultado con XTX, matriz PxP, que suele ser de menor tamaño) La matriz de covarianza Q tiene N autovalores con sus correspondientes autovectores (pueden ser calculados mediante la descomposición SVD (Singular Value Decomposition))

PCA Los autovalores y autovectores crean un nuevo espacio (autoespacio, eigenspace) Cada elemento de entrada (imagen) se puede escribir en función de dichos autovectores (los elementos e son los autovectores y g son las coordenadas del elemento en el nuevo espacio):

Valores medios y autovectores El resultado será una imagen media y las correspondientes imágenes para cada autovector. Aquí se muestran ordenadas por su autovalor asociado

PCA Resumen del método: Calculamos imagen media Se resta la media a cada imagen Se construye la matriz de covarianza Se calculan los autovalores y autovectores de dicha matriz La clave de este método es que solo los mayores autovalores son importantes, es decir, podemos eliminar los autovectores con un autovalor más pequeño

PCA Antes teníamos lo siguiente: Ahora, si tomamos solo los primeros k autovalores y autovectores

PCA Para calcular las coordenadas de una imagen en el nuevo espacio

Reconocimiento Primero calculamos las coordenadas de todas las imágenes de entrenamiento en el nuevo espacio Dependiendo de la aplicación, el proceso de reconocimiento puede variar Dada una nueva imagen, calculamos sus coordenadas en el nuevo espacio Si se trata de varios objetos o clases distintas, encontramos a qué elemento (o cluster) del conjunto de entrenamiento se parece más (está más cerca)

Reconocimiento de caras

Limitaciones Es necesario tener todas las imágenes, variando en pose y luminosidad Se asume un fondo constante y que se pueda segmentar fácilmente. No manejamos oclusión

Evolución 2000s: uso de características visuales Para reconocer un objeto se puede usar un grafo entre las características y emparejar grafos

Problemas en el reconocimiento (uno más) Cómo establecer categorías de objetos? Es ese objeto una silla?

Reconocimiento de categorías Muchos objetos comparten partes comunes (los coches tienen ruedas, los aviones alas) Las relaciones entre las partes son constantes (dos ojos encima de la boca) Comparten elementos de apariencia común (un extintor es siempre rojo) Se podrían usar las características visuales como partes de un objeto?

Bag of words Idea: sacar características y asociarlas a un vocabulario

Información de los descriptores Varios puntos característicos pueden tener una apariencia similar Se buscan grupos

Formación del diccionario Capturamos tantas características como podamos del entorno por el que nos vamos a mover Nos quedamos con sus descriptores Fijamos el tamaño del diccionario (número de palabras) y mediante alguna técnica (Kmedias, por ejemplo) agrupamos los descriptores Una palabra es un descriptor!

Reconocimiento Creamos un histograma de aparición de palabras

Reconocimiento Podemos reconocer usando métodos como comparación entre histogramas, SVM, naive bayes, etc.

Deep Learning En los últimos años se ha producido un gran auge de esta técnica debido a sus buenos resultados Surge en los 80s. Problema: lento de entrenar: aplicado a reconocimiento de caracteres escritos tarda 3 días en entrenar. Se basa en el uso de redes neuronales Reconocimiento: hasta ahora extraíamos características y luego entrenábamos con un clasificador. Deep learning persigue hacer las dos fases a la vez

Deep learning Características: Necesitan muchos datos para poder tener buenos resultados (aunque no tantos) Necesitan mucha potencia de cálculo para entrenar (uso de GPU)

Arquitecturas de deep learning Existen distintas arquitecturas. Vamos a ver una en concreto: convolutional neural networks Consta de un conjunto de capas de donde se aplican una serie de filtros convolucionales. Estos filtros se aprenden y se corresponden con las características Se produce un procesamiento por capas, donde cada capa es un escalado de las imágenes (pooling) La salida de estas capas se conecta a una capa fully connected red neuronal

Convolutional neural networks