Clasificación de objetos en imágenes usando SIFT
|
|
- Ana María Vázquez Ruiz
- hace 7 años
- Vistas:
Transcripción
1 Clasificación de objetos en imágenes usando SIFT Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández Proyecto del Curso Modelos Gráficos Probabilistas y sus aplicaciones Maestría en Ciencias Computacionales, INAOE. {mduarte, lchang}@ccc.inaoep.mx Resumen. En este trabajo se propone el uso de las características SIFT para resolver problemas de reconocimiento de clases de objetos en imágenes. El método propuesto realiza agrupamiento sobre los descriptores de los puntos detectados con el fin de caracterizar la apariencia de las clases. Luego, en la fase de clasificación se utiliza una Red Bayesiana de 3 niveles. Los experimentos realizados sobre la base de datos PASCAL muestran cuantitativamente que las características locales SIFT son apropiadas para representar clases de objetos. Además los mismos también muestran la robustez del método obtenido ante variaciones de iluminación, escala, rotación y oclusión. Palabras Claves: clasificación de objetos, características locales, SIFT, agrupamiento, redes bayesianas. 1 Introducción En los últimos años, las características locales (local features, en inglés) han demostrado ser muy efectivas en la búsqueda de características o rasgos distintivos entre diferentes vistas de un escenario. La idea tradicional de estos métodos es primero detectar estructuras o puntos significativos en la imagen y obtener una descripción discriminante de estas estructuras a partir de sus alrededores, la cual será utilizada luego para la comparación usando una medida de similitud entre estos descriptores. Un detector de puntos de interés es diseñado para encontrar el mismo punto en diferentes imágenes incluso si el punto está en distintas posiciones y escalas. Distintos métodos han sido propuestos en la literatura. Un estudio y comparación de estos se presenta en [13]. Uno de los métodos de características locales más popular y ampliamente utilizado es el SIFT (del inglés: Scale Invariant Features Transform) propuesto por Lowe [7]. Las características extraídas por el SIFT son en gran medida invariantes a la escala, rotación, cambios de iluminación, ruido y pequeños cambios de pose o perspectiva. Los descriptores basados en SIFT han mostrado mejores resultados que otros descriptores locales [10]. En un inicio, la utilización del SIFT y de los métodos de características locales en general en problemas de reconocimiento de objeto se resumía a detectar un objeto específico dentro de una escena (Ver Figura 1).
2 2 Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández Fig. 1. La utilización de los descriptores SIFT permite de manera directa poder encontrar un objeto específico en una escena. Se puede apreciar su robustez ante rotación, oclusión y escala. Como objetivo general de este proyecto se propone obtener un método que permita reconocer clases de objetos usando el SIFT. En otras palabras lo que se propone es lograr detectar en una escena, más que un objeto en específico, todos los objetos de una clase. Por ejemplo detectar cualquier avión, o cualquier cara, motocicleta, gato, hoja, etc. 2 Trabajos Relacionados La mayoría de los métodos de reconocimiento de clases de objetos basados en apariencia caracterizan los objetos por su apariencia global, usualmente la imagen completa [12] [11]. Estos métodos no son robustos a la oclusión ni a variaciones como rotación o escala. Más aún, estos métodos son aplicables solamente a objetos rígidos. Las características locales se han vuelto muy populares con el fin darle solución a las limitaciones de estos métodos en tareas de detección y reconocimiento de clases de objetos. Dentro del estado del arte del reconocimiento de clases de objetos, muchos métodos usan agrupamiento como un nivel intermedio de representación [1][6][2][8]. Algunos trabajos han sido reportados en la literatura con el fin de reconocer clases de objetos usando características locales. En [2] para la detección de las regiones usan el detector de Harris-Laplace [9] y el de Kadir y Brady [5]. Estas regiones son descritas usando el descriptor SIFT [7]. En este trabajo Dorkó y Schmid realizan agrupamiento sobre los descriptores con el fin de caracterizar la apariencia de las clases. Luego contruyen clasificadores de partes más
3 Clasificación de objetos en imágenes usando SIFT 3 pequeñas de los objetos a partir de los clusters formados, eliminando varios de ellos quedándose solamente con los más discriminativos. En la fase de clasificación cada uno de estos clasificadores es evaluado, permitiendo tomar una decisión sobre la clase del objeto. En [8] Mikolajczyk y colaboradores evalúan el desempeño de varios métodos de características locales en la tarea de reconocimiento de clases de objetos. Los detectores de regiones invariantes evaluados fueron Harris-Laplace, SIFT, Hessian-Laplace y MSER. Los descriptores de características evaluados fueron los descriptores SIFT, GLOH, PCA-SIFT, Momentos y Correlation Cruzada. En este trabajo los autores evalúan varias combinaciones detector-descriptor. En el mismo también se realiza agrupamiento sobre los descriptores con el fin de caracterizar la apariencia de las clases. Para la clasificación de una nueva muestra, los descriptores extraídos son macheados con los clusters obtenidos y un umbral determina la pertenencia a la clase. El método propuesto en este trabajo también realiza agrupamiento sobre los descriptores de los puntos extraídos de las imágenes de entrenamiento al igual que los trabajos anteriormente explicados. Se utiliza el detector y el descriptor SIFT. La principal diferencia respecto a estos métodos radica en el uso de una Red Bayesiana en la fase de clasificación. Además de que se presenta una experimentación más profunda para medir su comportamiento ante variaciones de iluminación, escala, pose y oclusión. 3 Descriptores de puntos claves SIFT Las primeras etapas del algoritmo SIFT encuentran las coordenadas de los puntos claves en determinada escala y a cada punto le asignan una orientación. Los resultados de estas etapas garantizan invariabilidad a localización en la imagen, escala y rotación. Luego se calcula un descriptor para cada punto clave. Este descriptor debe ser altamente distintivo y parcialmente robusto a otro tipo de variaciones como iluminación y perspectiva 3D. Lowe para crear su descriptor propone obtener un arreglo de 4 4 histogramas de 8 bins. Estos histogramas se calculan a partir de los valores de orientación y magnitud en una región de pixeles alrededor del punto de modo tal que cada histograma se forma de una subregión de 4 4. En su parte izquierda la Figura 2 muestra los valores de orientación y magnitud del gradiente alrededor del punto. En la parte derecha se muestran los histogramas para cada subregión donde la longitud de cada flecha corresponde a la suma de magnitudes del gradiente cerca de esa orientación. El descriptor consiste en un vector resultado de la concatenación de estos histogramas. Dado que son 4 4 = 16 histogramas de 8 bins cada uno, el vector resultante es de tamaño 128. Este vector es normalizado en aras de lograr invariabilidad a cambios de iluminación.
4 4 Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández Fig. 2. Esta figura muestra un descriptor de 2 2 calculado a partir de una región de 8 8 pixeles alrededor del punto clave. En este trabajo se utilizan descriptores de 4 4 en regiones de Aprendizaje de clases de objetos usando características SIFT Se desea obtener un modelo capaz de generalizar más allá de cada objeto dentro del conjunto de entrenamiento y que permita el aprendizaje de un modelo general de la clase. Además el aprendizaje debe ser posible a partir de un pequeño número de muestras. Con este fin y en concordancia con varios trabajos reportados en la literatura que fueron mencionados en la Sección 2 se realiza agrupamiento sobre los descriptores locales de las imágenes. La Figura 3 muestra un esquema a alto nivel del método propuesto, el cual es detallado a continuación: 1. Para cada imagen de entrenamiento se extraen sus características SIFT. 2. Luego se realiza agrupamiento sobre los descriptores extraídos. 3. Cada descriptor en cada cluster es etiquetado con su clase de pertenencia. Se espera que estos clusters tengan alta precisión, o sea, que cada cluster sea representativo de una clase solamente. En la práctica se demuestra que esto no siempre sucede por lo existirán clusters que son compartidos por varias clases. Métodos adicionales serán necesarios en la etapa de clasificación para resolver estas ambigüedades. 4.1 Agrupamiento de descriptores SIFT Para construir los clusters de descriptores se usa agrupamiento aglomerativo jerárquico propuesto por [4]. Este algoritmo no depende de la inicialización a diferencia de K-means o EM-clustering. Además esta reportado como superior a K-means en [3]. Dados F descriptores extraídos de cada imagen de entrenamiento el agrupamiento es inicializado con F clusters cada uno conteniendo 1 descriptor solamente. En cada iteración los dos clusters de mayor cohesión son unidos.
5 Clasificaci on de objetos en im agenes usando SIFT 5 Fig. 3. A partir de varias muestras de cada clase se agrupan los descriptores SIFT extra ıdos de cada imagen. La similaridad entre dos clusters cualesquiera puede ser medida de varias maneras, las m as comunes son vinculaci on simple, vinculaci on completa y vinculaci on media. En este trabajo se usa vinculaci on media, la cual se define como la distancia media de todo elemento de un cluster a todo elemento del otro cluster: D(k, l) = N M 1 XX d(kkm, Kln ), M N m=1 n=1 (1) donde M y N son la cantidad de descriptores en los clusters k y l respectivamente. El agrupamiento aglomerativo produce una jerarqu ıa de uniones de clusters hasta que el criterio de parada detiene el proceso. Por lo tanto, se obtienen clusters donde la similaridad entre cada par de clusters est a por encima de un valor dado. Este valor se usa como umbral para determinar el criterio de parada. Las principales desventajas del uso de estos m etodos radican en que son poco escalables ya que la complejidad en tiempo y memoria es O(F 2 ) y adem as de que no existe la posibilidad de relocalizar elementos que hayan sido agrupados de manera incorrecta.
6 6 Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández 5 Clasificación de objetos Dada una nueva muestra la clasificación se lleva a cabo primero extrayendo las características SIFT de la imagen de entrada. Luego para cada una de estas características se halla a que cluster del modelo aprendido corresponden y a partir de estos se determina la clase de la imagen de entrada. En la Figura 4 se muestra un diagrama a alto nivel del método propuesto. Fig. 4. Esquema de la clasificación para una nueva imagen. Las características SIFT de esta imagen son extraídas y para cada una de ellas identificados los cluster del modelo aprendido al que pertenecen. La clase de la imagen es la clase mayoritaria en estos clusters. Esta idea puede ser representada como una Red Bayesiana (RB) de 3 niveles. La representación gráfica de esta RB se muestra en la Figura 5. En el primer nivel se tienen los descriptores extraídos para el objeto que se desea clasificar representados por los nodos f 1, f 2,..., f F donde F es la cantidad de características extraídas de la imagen. En el segundo nivel se tienen los clusters obtenidos en la fase de entrenamiento representados por K 1, K 2,..., K N donde N es el número de clusters obtenidos. Finalmente, en el tercer nivel se tienen las clases de los objetos entrenados representados por C 1, C 2,..., C M donde M es la cantidad de clases. Usando este modelo, la clasificación de una nueva imagen I se realiza de la siguiente manera: 1. Extraer características SIFT de I.
7 Clasificación de objetos en imágenes usando SIFT 7 Fig. 5. Representación gráfica de la RB de 3 niveles utilizada para la clasificación de uno nuevo objeto. 2. Para cada descriptor f extraído de I obtener el cluster k f al que pertenece. Se selecciona el cluster cuya probabilidad de pertenencia sea mayor. Esta probabilidad es función de la distancia del descriptor al cluster la cual es normalizada por la distancia entre los dos clusters más lejanos. Se utiliza la misma distancia D empleada para realizar el agrupamiento la cual fue definida en la Ecuación 1: k f = arg max P (f K i )P (K i ), donde i D(f, K i ) P (f K i ) = 1 max kl D(K k, K l ) 3. Para cada cluster k f1, k f2,..., k ff seleccionado en la etapa anterior (nótese que varias de las características detectadas pueden estar en un mismo cluster) se obtiene la probabilidad de cada clase dada dicha evidencia, esta probabilidad es extraída del modelo entrenado, propagándose además la probabilidad obtenida en la etapa Finalmente se selecciona como la clase del objeto aquella cuya suma de probabilidades de ocurrencia dado cada uno de los cluster seleccionados en la etapa 2 sea mayor: c = arg max i 6 Experimentos y Resultados P (C i k f )P (k f ) En esta sección se describen los experimentos realizados al método propuesto y se analizan los principales resultados obtenidos. f
8 8 Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández 6.1 Entrenamiento Para realizar las pruebas se obtuvo un conjunto de imágenes de un repositorio en internet en la siguiente liga: /databases.html, en ésta base de datos se tiene un total de 102 clases y distintos número de imágenes por cada clase, el formato de las imágenes es JPG y el tamaño promedio de cada imagen es de pixeles. Esta base de datos pertenece a la comisión europea PASCAL, que tiene como objetivo la distribución de métodos de análisis de patrones y aprendizaje; como base para tecnologías de interfaces multi-modales, y es utilizada para trabajos que realicen éste tipo de tareas. La fase de entrenamiento del método propuesto es costosa respecto al uso de memoria RAM, por lo que se realizó el entrenamiento con tan sólo 20 imágenes de cada clase. El método de agrupamiento aglomerativo jerárquico necesita una matriz de disimilaridad, que es una matriz cuadrada. Dado que se tienen 4 clases y 20 imágenes por clase, que suman 80 imágenes para el entrenamiento, por cada imagen se obtiene en promedio 500 descriptores (cada descriptor es un vector de dimensión 128), teniendo así = 4000 descriptores y como la matriz es cuadrada se tiene en total 1, 600, 000, 000 descriptores. A pesar de contar con 3Gb de memoria RAM, para realizar el entrenamiento, estos cálculos ocasionan que la memoria se llene y si se aumenta el número de imágenes, entonces se desborda la memoria RAM. Se eligieron 4 clases al azar, al igual que las imágenes para realizar el entrenamiento y las clases fueron: Clase 1: Cámaras fotográficas. Clase 2: Billetes de dólar. Clase 3: Motocicletas. Clase 4: Relojes de pulsera. En la Figura 6 se muestran las imágenes con las que se realizó el entrenamiento. 6.2 Pruebas del sistema Se realizaron 2 experimentos, en el Experimento 1 se probó el método con 100 imágenes por cada clase, éstas imágenes tienen poca variación en oclusión, escala, iluminación, y rotación. En el Experimento 2 se obtuvo una muestra aleatoria de 10 imágenes para cada clase, y cada imagen sufre agresiones en iluminación, oclusión, rotación y escala, con el fin de probar la robustez del sistema ante estos cambios. A continuación se detallan los resultados. Experimento 1 El sistema recibe el conjunto de imágenes a clasificar, las imágenes se deben etiquetar con el número de la clase a la que pertenecen, así, las cámaras comienzan con un 1, las de dólar con 2, las motos con 3 y las de reloj con 4. Una vez que el sistema obtiene los descriptores y clasifica la imagen, revisa
9 Clasificaci on de objetos en im agenes usando SIFT 9 Fig. 6. Im agenes del entrenamiento. si coincide con el primer car acter que aparece en el nombre de la imagen y si no es el mismo, entonces coloca una copia de la imagen en una carpeta, colocando despu es de el primer car acter un gui on y el n umero con el que se clasific o, para que podamos identificar claramente las im agenes que se han clasificado mal. Debido a que las clases no conten ıan suficientes elementos para realizar las pruebas, se descargaron el resto de las im agenes de internet; con el fin de tener las im agenes completas y las clases equilibradas. En la Tabla 1 se muestran los resultados obtenidos por el sistema de clasificaci on propuesto, para 100 im agenes por cada clase. Para interpretar los datos de la Tabla 1 obtuvimos las matrices de confusi on para cada clase; una matriz de confusi on es formada como se muestra en la Tabla 2. Donde el total de elementos por clases est a dado por N, y N = T P +F N +F P + T N. La precisi on es igual a P recision = T P/N y mide que porcentaje clasificado es correcto. El recuerdo se expresa como Recuerdo = T P/(T P + F N ), y calcula cuantos elementos de todos los que deber ıa haber encontrado, se clasificaron bien. TrueNegativeRate o Specificity, est a medida obtiene el porcentaje de que cuantos ejemplos negativos son verdaderamente negativos y se obtiene mediante
10 10 Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández Tabla 1. Objetos clasificados para cada una de las clases con el método propuesto para el Experimento 1. CLASE Imagen Cámara Dólar Motos Reloj Cámara Dólar Motos Reloj T NR = T N/(F N +F P ). Accuracy, calcula el porcentaje de que las predicciones sean correctas y se calcula con la formula accuracy = (T P + T N)/N. Tabla 2. Elementos de una matriz de confusión Clase TP = verdaderos positivos FN = falsos negativos FP = falsos positivos TN = verdaderos negativos En la Tabla 3 se muestran las matrices de confusión para cada una de las clases, que fueron obtenidos a partir de la Tabla 1. Tabla 3. Matriz de confusión para cada clase Cámara Dólar Moto Reloj Tabla 4. Medidas de evaluación del clasificador propuesto Recuerdo % Precisión % TrueNegativeRate % Accuracy % Cámara Dólar Moto Reloj Promedio En este experimento se tiene una precisión en promedio del 93% un recuerdo del 90%, es decir que casi todas las imágenes son correctamente clasificadas.
11 Clasificación de objetos en imágenes usando SIFT 11 Experimento 2 Se descargaron de Internet 40 imágenes por cada clase para formar un conjunto de prueba en las cuales se tuvieran problemas de iluminación, rotación, oclusión, y escala. Algunas imágenes fueron alteradas con el programa GIMP 2.4. Para aplicar cambios de iluminación para cada imagen se le aplicó la función curves, se le quitó el 50% de brillo a la imagen original. Para la oclusión se insertaron figuras como rectángulos, círculos, estrellas, etc., ocluyendo hasta un 40% la imagen original. Para la escala se agrandó cada imagen al doble de su tamaño original y también se redujo un 50% del tamaño original. Finalmente para la rotación, se cuenta con la función Transform que realiza rotaciones, y aplicamos rotaciones de 45, 90 y 180 grados. En la Figura 7 se muestran algunas imágenes con los cambios mencionados. Fig. 7. Ejemplos de imágenes del conjunto de pruebas 2. Se pueden apreciar los problemas de iluminación, oclusión y rotación que presentan. Los resultados obtenidos después de alterar las imágenes se muestran en la Tabla 5. Los resultados muestran que la clase reloj es la más afectada en oclusión, iluminación, y al cambiar el tamaño de cada imagen de esta clase. Tabla 5. Resultados del Experimento 2. Oclusión Iluminación Tamaño-Doble Tamaño-Mitad Rotación Clase bien% mal% bien% mal% bien% mal% bien% mal% bien% mal% Cámara Dólar Moto Reloj
12 12 Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández Se obtuvo la matriz de confusión para cada clase y se calcularon las medidas de evaluación que se muestran en la Tabla 6. Tabla 6. Medidas de evaluación del Experimento 2. Recuerdo % Precisión % TrueNegativeRate % Accuracy % Cámara Dólar Moto Reloj Promedio En la Tabla 6, se nota que se conserva un alto porcentaje en promedio en todas las medidas de evaluación del clasificador, y esto demuestra que el sistema propuesto es robusto ante la oclusión, iluminación, escala y rotación. 6.3 Evaluación del agrupamiento para la representación de clases de objetos Con fin de evaluar la mejora que introduce el agrupamiento de los descriptores en la representación de clases de objetos en esta sección comparamos el método propuesto en este trabajo con un método directo de clasificación usando también características SIFT al que llamaremos BASELINE. Este método es descrito a continuación. 1. Extraer características SIFT de cada imagen del conjunto de entrenamiento. 2. Para una nueva imagen I extraer su características. 3. Esta imagen es macheada con cada una de las imágenes del conjunto de entrenamiento. El método de macheo utilizado es el propuesto por Lowe en [7]. 4. La clase de la imagen de entrada será aquella que reciba mayor cantidad de correspondencias con la imagen I. Para realizar este experimento se utilizaron las mismas imágenes de entrenamiento que en los Experimentos 1 y 2. La clasificación fue realizada con el mismo conjunto de datos que el Experimento 1. En la Tabla 7 se muestran los resultados para ese conjunto de imágenes. Es notable que la clase de las motos está muy bien clasificada ya que tiene de 100 imágenes encuentra 95 sin embargo, las demás clases cuando se equivocan clasifican a los objetos, en la mayoría de los casos en clase motos; esto nos indica que la clase motos contiene los descriptores más similares a los descriptores de las demás clases y que los descriptores por sí solos usados con este tipo de esquemas no tienen gran poder de generalización.
13 Clasificación de objetos en imágenes usando SIFT 13 Tabla 7. Resultados de la clasificación usando el método BASELINE. CLASE Imagen Cámara Dólar Motos Reloj Cámara Dólar Motos Reloj Tabla 8. Evaluación del método BASELINE. Recuerdo % Precisión % TrueNegativeRate % Accuracy % Cámara Dólar Moto Reloj Promedio Después de obtener las matrices de confusión para cada clase, se realizaron los cálculos para encontrar la precisión, el recuerdo, el True Negative Rate y el accuracy de este clasificador. Los resultados se expresan en la Tabla 8. De la Tabla 8 y la Tabla 4 se obtiene la Tabla 9 en donde se comparan los resultados del método BASELINE y el Experimento 1. Ambos experimentos fueron realizados sobre el mismo conjunto de entrenamiento y prueba. Tabla 9. Comparación entre BASELINE y Experimento 1. BASELINE Método propuesto Recuerdo % Precisión % TrueNegativeRate % Accuracy % Con el método propuesto se obtiene un recuerdo del 90% que es superior al 68% que se obtiene sin agrupar los descriptores; el recuerdo indica de los 100 objetos que se debían de clasificar cuantos fueron correctamente clasificados. Para la precisión se obtiene un 93% que es superior al 80.9% que se obtuvo sin realizar agrupamiento, la precisión indica el porcentaje de elementos que fueron clasificados como pertenecientes a la clase con respecto al número de elementos que se debieron tomar en cuenta. El true negative rate mide el porcentaje de los elementos que no pertenecen a la clase, con respecto a los elementos que no pertenecen y con los que se equivocó en clasificar, es decir, de todos los que debió de clasificar como no pertenecientes en verdad los pudo distinguir; para
14 14 Miriam Mónica Duarte Villaseñor y Leonardo Chang Fernández el método propuesto se obtiene un 97.6% que indica que muy pocas veces se ha equivocado,estos elementos son los falsos positivos, y el método que no utiliza agrupamiento tiende a equivocarse más ya que tiene obtiene 89.3%. El accuracy mide el porcentaje de elementos que son correctamente clasificados, tanto para los elementos que pertenecen a cada clase como a los que se ha clasificado como no pertenecientes a esa clase, y el método propuesto supera en un 10% al método que no utiliza agrupamiento. 7 Conclusiones Como resultado de este trabajo se obtuvo un método para la clasificación de objetos usando características SIFT. El método propuesto realiza agrupamiento sobre los descriptores de los puntos detectados con el fin de caracterizar la apariencia de las clases. Los experimentos mostraron que estas características son apropiadas para representar clases de objetos. Además de mantener invariabilidad antes cambios de iluminación, escala, rotación y oclusión. Las pruebas realizadas mostraron valores de precisión promedios por encima del 90%. En este trabajo también se mostró la aplicación de Redes Bayesianas a problemas de reconocimiento de clases de objetos, mejorando la clasificación. 7.1 Trabajo futuro Como trabajo futuro se propone usar alguna extensión del método de clustering utilizado que permita reducir la complejidad en espacio en memoria de cuadrático a lineal, para de esta manera poder incluir más clases y más imágenes por clase en el conjunto de entrenamiento. También se propone utilizar otro detector y/o descriptor que permita obtener un modelo que mejor generalice a la clase. Referencias 1. Shivani Agarwal, Aatif Awan, and Dan Roth. Learning to detect objects in images via a sparse, part-based representation. IEEE Trans. Pattern Anal. Mach. Intell., 26(11): , Gyuri Dorkó and Cordelia Schmid. Object class recognition using discriminative local features. Technical report, IEEE Transactions on Pattern Analysis and Machine Intelligence, Anil K. Jain and Richard C. Dubes. Algorithms for clustering data. Prentice-Hall, Inc., Upper Saddle River, NJ, USA, S. C. Johnson. Hierarchical clustering schemes. Psychometrika, 2: , Timor Kadir and Michael Brady. Scale, saliency and image description. International Journal of Computer Vision, 45(2):83 105, Bastian Leibe, Edgar Seemann, and Bernt Schiele. Pedestrian detection in crowded scenes. In CVPR 05: Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 05) - Volume 1, pages , Washington, DC, USA, IEEE Computer Society.
15 Clasificación de objetos en imágenes usando SIFT David G. Lowe. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 60(2):91 110, Krystian Mikolajczyk, Bastian Leibe, and Bernt Schiele. Local features for object class recognition. In ICCV 05: Proceedings of the Tenth IEEE International Conference on Computer Vision, pages , Washington, DC, USA, IEEE Computer Society. 9. Krystian Mikolajczyk and Cordelia Schmid. Indexing based on scale invariant interest points, Krystian Mikolajczyk and Cordelia Schmid. A performance evaluation of local descriptors. IEEE Trans. Pattern Anal. Mach. Intell., 27(10): , Constantine Papageorgiou and Tomaso Poggio. A trainable system for object detection. Int. J. Comput. Vision, 38(1):15 33, Kah-Kay Sung and Tomaso Poggio. Example-based learning for view-based human face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20:39 51, Tinne Tuytelaars and Krystian Mikolajczyk. Local invariant feature detectors: A survey. Foundations and Trends in Computer Graphics and Vision, 3(3): , 2007.
Técnicas de inteligencia artificial. Visión Artificial Extracción de características
Técnicas de inteligencia artificial Visión Artificial Extracción de características Indice Transformada de Hough Características: SIFT Transformada de Hough Fundamentos: Motivación: Desarrollar técnicas
Object detection and localization using local and global features
Object detection and localization using local and global features K. Murphy, A. Torralba, D. Eaton, and W. Freeman Victor Hugo Arroyo Dominguez 1 Instituto Nacional de Astrofísica Óptica y Electrónica
Sistemas de Percepción Visión por Computador
Nota: Algunas de las imágenes que aparecen en esta presentación provienen del libro: Visión por Computador: fundamentos y métodos. Arturo de la Escalera Hueso. Prentice Hall. Sistemas de Percepción Visión
Aprendizaje de intervalos para Redes Bayesianas de Nodos Temporales
Aprendizaje de intervalos para Redes Bayesianas de Nodos Temporales Pablo F. Hernández Leal Instituto Nacional de Astrofísica, Óptica y Electrónica Coordinación de Ciencias Computacionales Resumen En este
ESTIMACIÓN N DE LA DISTANCIA RECORRIDA POR UN ROBOT MÓVIL M MEDIANTE LA UTILIZACIÓN N DE DESCRIPTORES SURF
ESTIMACIÓN N DE LA DISTANCIA RECORRIDA POR UN ROBOT MÓVIL M MEDIANTE LA UTILIZACIÓN N DE DESCRIPTORES SURF Autor: Juan Manuel Peraza Domínguez Tutor: Dr. Luis Moreno Lorente Noviembre de 2009 1 ÍNDICE
RECONOCIMIENTO DE RUTAS DE ESCALADA EN PAREDES DE PIEDRA
RECONOCIMIENTO DE RUTAS DE ESCALADA EN PAREDES DE PIEDRA PROCESAMIENTO DE IMÁGENES DIGITALES Curso 2013/2014 Carlos Falgueras García David Solís Martín Adrián Fernández Sola 1. Introducción Existen varios
Análisis de Datos. Introducción al aprendizaje supervisado. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Introducción al aprendizaje supervisado Profesor: Dr. Wilfrido Gómez Flores 1 Conceptos básicos Desde la antigüedad, el problema de buscar patrones en datos es fundamental en diversas
DETECCIÓN Y DESCRIPCIÓN DE PUNTOS CARACTERÍSTICOS EN IMÁGENES MULTIESPECTRALES UTILIZANDO ESQUEMAS CLÁSICOS
DETECCIÓN Y DESCRIPCIÓN DE PUNTOS CARACTERÍSTICOS EN IMÁGENES MULTIESPECTRALES UTILIZANDO ESQUEMAS CLÁSICOS Wilfrido Rolando Guerrero Albán Facultad de Ingeniería en Electricidad y Computación Escuela
Visión de Alto Nivel
Visión de Alto Nivel Dr. Luis Enrique Sucar INAOE esucar@inaoep.mx ccc.inaoep.mx/~esucar Sesión 4 Características 1 Visión de Alto Nivel Obtiene una interpretación consistente de las características obtenidas
Técnicas de inteligencia artificial. Visión Artificial Reconocimiento de objetos
Técnicas de inteligencia artificial Visión Artificial Reconocimiento de objetos Indice Introducción Reconocimiento mediante características PCA Introducción El reconocimiento de objetos consiste en, dado
Sistema de apoyo al repostaje en vuelo basado en Visión artificial
Sistema de apoyo al repostaje en vuelo basado en Visión artificial GRUPO DE PROCESADO MULTIMEDIA DEPARTAMENTO DE TEORÍA DE LA SEÑAL UNIVERSIDAD CARLOS III DE MADRID Objetivos del proyecto y propuesta de
Detección de rostros humanos mediante SVM y generación de fotografías de tipo carné
Detección de rostros humanos mediante SVM y generación de fotografías de tipo carné Daniel J. Calandria, Antonio Cañas, Antonio F. Díaz Departamento de Arquitectura y Tecnología de Computadores E. T. S.
8. Anexos Anexo A: Aplicación del método SIFT y SURF para detectar puntos característicos en un dominio de flores
8. Anexos - Anexo A: Aplicación del método SIFT y SURF para detectar puntos característicos en un dominio de flores - Anexo B: Aplicación del método SIFT y SURF para detectar puntos característicos en
Visión por computadora Computer vision
Visión por computadora Computer vision Conjunto de algoritmos que permiten obtener una representación visual del mundo, suficiente para la realización de una tarea dada. Representación visual El mundo:
Tareas de la minería de datos: clasificación. CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR
Tareas de la minería de datos: clasificación CI-2352 Intr. a la minería de datos Prof. Braulio José Solano Rojas ECCI, UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja
Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F
Apéndices 77 Apéndice A: Matrices de confusión y resultados de precisión, exhaustividad y medida F En este apéndice se presentan seis tablas con otros resultados obtenidos. En cada una de las primeras
Extracción de características
Extracción de características Gonzalez & Woods, Digital Image Processing, cap. 8 extracción de características 1 Propiedades de las características Tienen que ser robustos: la extracción debe ser insensible
Filtrado de Imágenes y Detección de Orillas Utilizando un Filtro Promediador Móvil Multipunto Unidimensional
Filtrado de Imágenes y Detección de Orillas Utilizando un Filtro Promediador Móvil Multipunto Unidimensional Mario A. Bueno a, Josué Álvarez-Borrego b, Leonardo Acho a y Vitaly Kober c mbueno@cicese.mx,
RECONOCIMIENTO DE PAUTAS
RECONOCIMIENTO DE PAUTAS ANÁLISIS DISCRIMINANTE (Discriminant analysis) Reconocimiento de pautas supervisado si se cuenta con objetos cuya pertenencia a un grupo es conocida métodos: análisis de discriminantes
UN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS
UNIVERSIDAD DE MÁLAGA ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA INFORMÁTICA INGENIERÍA SUPERIOR EN INFORMÁTICA ANTEPROYECTO UN SISTEMA DE VIDEO VIGILANCIA PARA DETECCIÓN DE CAÍDAS DIRECTOR DEL PROYECTO: FIRMA:
PROGRAMA DE CURSO. Personal CC3301 Programación de Software de Sistemas Resultados de Aprendizaje
PROGRAMA DE CURSO Código Nombre CC5204 Búsqueda y Análisis de Imágenes y Videos Nombre en Inglés Image and Video Retrieval SCT Unidades Horas de Horas Docencia Horas de Trabajo Docentes Cátedra Auxiliar
Deteccio n de monedas con el me todo de la transformada de Hough
Deteccio n de monedas con el me todo de la transformada de Hough G R U P O 10 C A R L O S H E R C E G U I L L E R M O G U T I É R R E Z Procesamiento de Imágenes Digitales Ingeniería en Informática. Enero
Detección de sombreros en imágenes de rostro con fondo uniforme Detecting hats in face images with uniform background
Tipo de artículo: Artículo original Temática: Reconocimiento de patrones Recibido: 01/10/2015 Aceptado: 20/12/2015 Detección de sombreros en imágenes de rostro con fondo uniforme Detecting hats in face
Análisis de Datos. Combinación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Combinación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción Diversos algoritmos de clasificación están limitados a resolver problemas binarios, es decir, con dos
Visión. Sesión 3: Clasificación de imágenes mediante histogramas y características. Departamento CCIA
Visión Sesión 3: Clasificación de imágenes mediante histogramas y características Departamento CCIA http://www.jtech.ua.es/vision/2011/ Hoy Aplicaciones: emparejamiento de imágenes, búsqueda de patrones
Análisis de Datos. Validación de clasificadores. Profesor: Dr. Wilfrido Gómez Flores
Análisis de Datos Validación de clasificadores Profesor: Dr. Wilfrido Gómez Flores 1 Introducción La mayoría de los clasificadores que se han visto requieren de uno o más parámetros definidos libremente,
Detección y segmentación de objetos
24 de abril de 2013 ¾Qué es segmentación? Segmentación Objetivo El objetivo de la segmentación de una imagen es el agrupamiento de ciertos píxeles de la imagen en regiones correspondientes a objetos contenidos
[20380] Visió per Computador Prueba 2 (2013) Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)
102784 [20380] Visió per Computador Prueba 2 (2013) Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada) 1. En cuál de estas posibles aplicaciones podríamos utilizar una característica
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA. Ricardo Aler Mur
Aprendizaje Automático para el Análisis de Datos GRADO EN ESTADÍSTICA Y EMPRESA Ricardo Aler Mur EVALUACIÓN Evaluación: entrenamiento y test Una vez obtenido el conocimiento es necesario validarlo para
6. Conclusiones y trabajo
Capítulo 6. Conclusiones y trabajo futuro En esta sección se dan las conclusiones a las que se llegaron a lo largo del desarrollo de esta investigación. Así mismo, se enlista el conjunto de aportaciones
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON
INTRODUCTION TO MACHINE LEARNING ISABELLE GUYON 2008-02-31 Notas tomadas por: María Eugenia Rojas Qué es Machine Learning? El proceso de aprendizaje de maquina consiste en tener una gran base de datos
Prueba II. Procesamiento Digital de Imágenes
Prueba II Procesamiento Digital de Imágenes Nombre: Firma: Fecha: /nov/2005.- Escriba el pseudo código para implementar la operación morfológica dilatación, con el siguiente elemento estructurante : función
Tratamiento de imágenes
Tratamiento de imágenes Clasificación y Descripción Héctor Alejandro Montes h.a.montes@fi.uaemex.mx http://fi.uaemex.mx/h.a.montes 03/10/15 Héctor Alejandro Montes 1 Advertencia No use estas diapositivas
Caracterización de Imágenes
de Imágenes Visión Artificial Andrea Rueda Pontificia Universidad Javeriana Departamento de Ingeniería de Sistemas Caracterizar: "determinar los atributos peculiares de alguien o de algo, de modo que claramente
Random Subspace Method. Índice. 1. Random Subspace Method. 1. Introducción. 2. Objetivo. 3. Implementación. 4. Evaluación. 5.
The Random Subspace Method for Constructing Decision Forests (IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 20, NO. 8, AUGUST 1998) Iñigo Barandiaran 1 Índice 1. Random Subspace
Tareas de la minería de datos: clasificación. PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR
Tareas de la minería de datos: clasificación PF-5028 Minería de datos Prof. Braulio José Solano Rojas UCR Tareas de la minería de datos: clasificación Clasificación (discriminación) Empareja o asocia datos
Tabla 7: Ejemplo matriz CaractE
8 RESULTADOS EXPERIMENTALES 8.1 MATRICES DE CARACTERÍSTICAS Con el fin de dar una idea más precisa de cómo se conforman las matrices de características usadas en el reconocimiento de patrones y qué valores
Selección de atributos
Selección de atributos Series Temporales Máster en Computación Universitat Politècnica de Catalunya Dra. Alicia Troncoso Lora 1 Contenido Introducción Clasificación de las técnicas Esquema General Evaluadores
Experimentos Introducción
Capítulo 5 Experimentos 5.1. Introducción En este capítulo se describirán los desarrollos y resultados de los experimentos realizados con el sistema de reconocimiento de voz presentado en este proyecto.
Minería de Datos Web. Cursada 2018
Minería de Datos Web Cursada 2018 Proceso de Minería de Texto Clustering de Documentos Clasificación de Documentos Es un método supervisado para dividir documentos en base a categorías predefinidas Los
Introducción Algoritmos de detección de esquinas SIFT
Tabla de Contenidos Introducción Algoritmos de detección de esquinas SIFT Técnicas Avanzadas de Visión por Computador 1 Introducción Técnicas Avanzadas de Visión por Computador Las esquinas como puntos
Marcas de agua (Watermarking) en imágenes, aplicadas en el dominio espacial basadas en Correlación
Marcas de agua (Watermarking) en imágenes, aplicadas en el dominio espacial basadas en Correlación Godoy Matías, Mignola César Captura y Procesamiento Digital de Señales e Imágenes Trabajo práctico final
Detección de sombreros en imágenes de rostro con fondo uniforme Detecting hats in face images with uniform background
Tipo de artículo: Artículo original Detección de sombreros en imágenes de rostro con fondo uniforme Detecting hats in face images with uniform background Lic. Jesús Pérez-Martín 1*, Dr.Sc Yenisel Plasencia
ANÁLISIS DE DATOS. Jesús García Herrero
ANÁLISIS DE DATOS Jesús García Herrero ANALISIS DE DATOS EJERCICIOS Una empresa de seguros de automóviles quiere utilizar los datos sobre sus clientes para obtener reglas útiles que permita clasificar
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN PROCESOS Y CASOS DE ESTUDIO CURSO DE DOCTORADO Dr. Ramón García-Martínez CORRESPONDENCIA ENTRE PROCESOS DE EXPLOTACION DE INFORMACION, TECNOLOGIAS
Pattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
CAPÍTULO 4. PRUEBAS Y RESULTADOS. la mayor confiabilidad e integridad posible de la información en todas sus fases, esto se
CAPÍTULO 4. PRUEBAS Y RESULTADOS. El reconocimiento de objetos mediante la Transformada de Distancia debe ofrecer la mayor confiabilidad e integridad posible de la información en todas sus fases, esto
Clasificación de documentos
Minería de Datos Web P r o f. D r. M a r c e l o G. A r m e n t a n o I S I S TA N, F a c. d e C s. E x a c t a s, U N I C E N m a r c e l o. a r m e n t a n o @ i s i s t a n. u n i c e n. e d u. a r
II. 2. Análisis manual de imágenes médicas: Análisis de la curva ROC (Receiver Operating Characteristic).
II. 2. Análisis manual de imágenes médicas: Análisis de la curva ROC (Receiver Operating Characteristic). Psicofísica: calidad física de una imagen médica y calidad del diagnóstico El análisis de la curva
Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo
2012 Aprendizaje para Clasificación con Factorización Matricial Basado en Listwise para Filtrado Colaborativo Iván López Espejo 22/04/2012 2 Aprendizaje para Clasificación con Factorización Matricial Basado
Sistema robusto para la detección y seguimiento de personas en aplicaciones video-vigilancia.
Sistema robusto para la detección y seguimiento de personas en aplicaciones video-vigilancia. Marcos Baptista Ríos, Carlos Martínez García, Cristina Losada Gutiérrez y Marta Marrón Romera Departamento
PRÁCTICA 2. Detección de características entre pares de imágenes y reconstrucción proyectiva y euclídea entre los puntos correspondidos
PRÁCTICA 2 TÍTULO Detección de características entre pares de imágenes y reconstrucción proyectiva y euclídea entre los puntos correspondidos OBJETIVO El objetivo de la práctica es que el alumno realiza
Técnicas Avanzadas de Visión por Computador
Técnicas Avanzadas de Visión por Computador Sistemas Informáticos Avanzados Índice Introducción. Registrado basado en grises. Funciones criterio. Métodos de minimización. Registrado multimodal. Registrado
1. Análisis de Conglomerados
1. Análisis de Conglomerados El objetivo de este análisis es formar grupos de observaciones, de manera que todas las unidades en un grupo sean similares entre ellas pero que sean diferentes a aquellas
Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A
Tema 5: SEGMENTACIÓN (II) 1 I N G E N I E R Í A I N F O R M Á T I C A Tema 5: Segmentación Los algoritmos de segmentación se basan en propiedades básicas de los valores del nivel de gris: 2 - Discontinuidad:
Redes de Neuronas de Base Radial
Redes de Neuronas de Base Radial 1 Introducción Redes multicapa con conexiones hacia delante Única capa oculta Las neuronas ocultas poseen carácter local Cada neurona oculta se activa en una región distinta
Reconocimiento de Patrones
Reconocimiento de Patrones Técnicas de validación (Clasificación Supervisada) Jesús Ariel Carrasco Ochoa Instituto Nacional de Astrofísica, Óptica y Electrónica Clasificación Supervisada Para qué evaluar
Tema 5: SEGMENTACIÓN (II) I N G E N I E R Í A I N F O R M Á T I C A
Tema 5: SEGMENTACIÓN (II) 1 I N G E N I E R Í A I N F O R M Á T I C A Tema 5: Segmentación Los algoritmos de segmentación se basan en propiedades básicas de los valores del nivel de gris: 2 - Discontinuidad:
6 Analizador de escena
Reconocimiento de señales de tráfico para un sistema de ayuda a la conducción 6 Analizador de escena 6.1 Objetivo y funcionamiento Hasta ahora se ha explicado el proceso de extracción de información de
Etiquetado Automático de Imágenes Usando Múltiples Segmentaciones Basándose en Modelos Probabilistas
Etiquetado Automático de Imágenes Usando Múltiples Segmentaciones Basándose en Modelos Probabilistas Gerardo Arellano Cervantes Instituto Nacional de Astrofísica Óptica Y Electrónica Cordinacción de Ciencias
Capitulo 1: Introducción al reconocimiento de patrones (Secciones )
Capitulo 1: Introducción al reconocimiento de patrones (Secciones 1.1-1.6) M A C H I N E P E R C E P T I O N U N E J E M P L O S I S T E M A S D E R E C O N O C I M I E N T O D E P A T R O N E S C I C
Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary
Object Recognition as Machine Translation: Learning a Lexicon for a Fixed Image Vocabulary P. Duygulu, K. Barnard, J.F.G. de Freitas, and D.A. Forsyth Dr. Enrique Sucar 1 Victor Hugo Arroyo Dominguez 1
DETECCIÓN DE PLAQUITAS EN UN CABEZAL DE FRESADO USANDO CORRESPONDENCIA DE PLANTILLAS
ISBN 978-84-15914-12-9 2015 Comité Español de Automática de la IFAC (CEA-IFAC) 80 DETECCIÓN DE PLAQUITAS EN UN CABEZAL DE FRESADO USANDO CORRESPONDENCIA DE PLANTILLAS Nadia Aller-Álvarez León, España,
Reconocimiento de Caracteres: Un abordaje invariante a translación, rotación y escala
Reconocimiento de Caracteres: Un abordaje invariante a translación, rotación y escala Jesús P. Mena-Chalco jmena@vision.ime.usp.br Departamento de Ciência da Computação Instituto de Matemática e Estatística
Lingüística computacional
Lingüística computacional Definición y alcance Escuela Nacional de Antropología e Historia (ENAH) Agosto diciembre de 2015 Lingüística Ciencias de la computación Lingüística computacional Estudio del lenguaje
Clasificación Supervisada. Métodos jerárquicos. CART
Clasificación Supervisada. Métodos jerárquicos. CART Ricardo Fraiman 2 de abril de 2010 Descripción del problema Muestra de entrenamiento (X 1, Y 1 ),..., (X n, Y n ) E {1,..., m}. Típicamente E = R d.
Extracción de Bordes
Visión por Computadora Unidad IV Extracción de Bordes Rogelio Ferreira Escutia Contenido 1) Conceptos sobre Bordes 2) Extracción de bordes por Derivadas 3) Operadores de Primera Derivada 1) Conceptos sobre
Figura 1: Propiedades de textura: (a) Suavidad, (b) Rugosidad y (c) Regularidad
3 TEXTURA 3.1 CONCEPTO DE LA TEXTURA La textura es una característica importante utilizada en segmentación, identificación de objetos o regiones de interés en una imagen y obtención de forma. El uso de
Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN
Anexo I CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN 165 ENCUESTA DE COMPORTAMIENTOS Y TIPOLOGÍAS DE VISITANTES EN EUSKADI 166 ANEXO I. CUESTIONARIO UTILIZADO PARA LA RECOGIDA DE INFORMACIÓN
Jone Echazarra Tecanalia. Más allá del ojo humano: detección precoz del mildiu
Jone Echazarra Tecanalia Más allá del ojo humano: detección precoz del mildiu INDICE 1) Grupo de computer vision Tecnalia, antecedentes, experiencia previa 2) Breve descripción de las tecnologías que se
ANÁLISIS DE EFICIENCIA EN ALGORITMOS DE RECONOCIMIENTO DE IMÁGENES DIGITALES APLICABLES A DISPOSITIVOS MÓVILES BAJO LA PLATAFORMA ANDROID
ANÁLISIS DE EFICIENCIA EN ALGORITMOS DE RECONOCIMIENTO DE IMÁGENES DIGITALES APLICABLES A DISPOSITIVOS MÓVILES BAJO LA PLATAFORMA ANDROID Miguel Ñauñay Ilbay 1, Luis Tipantuña Córdova 2, Geovanny Raura
Proyecto Final - Reconocimiento de Patrones
Proyecto Final - Reconocimiento de Patrones Salim Perchy Maestría en Ingeniería Énfasis en Computación Pontificia Universidad Javeriana Cali, Valle del Cauca Email: ysperchy@cic.javerianacali.edu.co Mario
Inteligencia Artificial (Curso ) Grado en Ingeniería Informática - Ingeniería del Software
Inteligencia Artificial (Curso 0-0) Grado en Ingeniería Informática - Ingeniería del Software Redes neuronales Cuestión : Decir si las siguientes afirmaciones son verdaderas o falsas: Si tomamos la función
Macro para evaluación de modelos con variables de respuesta dicotómicas con fines de priorización.
Macro para evaluación de modelos con variables de respuesta dicotómicas con fines de priorización. 21-Ago-2014 Introducción Uno de los principales problemas en la construcción de modelos con variables
Francisco J. Hernández López
Francisco J. Hernández López fcoj23@cimat.mx La salida de un algoritmo de seguimiento de objetos depende de la aplicación y la representación utilizada para describir el objeto que se desea seguir, dicha
Modelado de una Gramática Visual para el Reconocimiento de Rostros.
Modelado de una Gramática Visual para el Reconocimiento de Rostros. Augusto Meléndez Teodoro, Instituto Nacional de Astrofísica, Optica y Electronica, Coordinacion de Ciencias Computacionales, Modelos
CAPÍTULO 2 MARCO TEÓRICO
CAPÍTULO 2 MARCO TEÓRICO Reconocimiento de Patrones El reconocimiento de patrones es utiliza actualmente para la solución de tareas tales como el reconocimiento de caracteres, de huellas digitales y reconocimiento
Visión artificial y Robótica. Depto. de Ciencia de la Computación e Inteligencia Artificial
Visión artificial y Robótica Depto. de Ciencia de la Computación e Inteligencia Artificial Contenidos Definición y clasificación Reconocimiento basado en la apariencia Bag of words Deep learning Parte
Aprendizaje Automatizado
Aprendizaje Automatizado Aprendizaje Automatizado Programas que mejoran su comportamiento con la experiencia. Dos formas de adquirir experiencia: A partir de ejemplos suministrados por un usuario (un conjunto
Módulo Minería de Datos Diplomado. Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS
Módulo Minería de Datos Diplomado Por Elizabeth León Guzmán, Ph.D. Profesora Ingeniería de Sistemas Grupo de Investigación MIDAS Error de clasificación Algoritmo de aprendizaje h Entrenamiento DATOS Evaluación
Relación 7 - Redes neuronales
Sistemas Inteligentes 0-0 Relación - Redes neuronales Problemas Ejercicio. Explicar cómo se usaría una red neuronal para obtener un reconocedor de letras escritas a mano. Describir con precisión qué estructura
Aprendizaje No Supervisado
Aprendizaje Automático Segundo Cuatrimestre de 2015 Aprendizaje No Supervisado Supervisado vs. No Supervisado Aprendizaje Supervisado Clasificación y regresión. Requiere instancias etiquetadas para entrenamiento.
Representación y Descripción
Representación y Descripción Introducción La representation se utiliza para hacer los datos útiles a una computadora (posterior descripción del proceso) representando una región en 2 formas en términos
License Plate Detection using Neural Networks
License Plate Detection using Neural Networks Luis Carrera, Marco Mora Les Fous du Pixel Image Processing Research Group Department of Computer Science Catholic University of Maule http://www.lfdp-iprg.net
CAPÍTULO 4. ANÁLISIS DE LA INFLUENCIA DEL INTERVALO DE TIEMPO UTILIZADO EN EL SEGUIMIENTO EN LOS RESULTADOS DE LA PREVISIÓN
CAPÍTULO 4. ANÁLISIS DE LA INFLUENCIA DEL INTERVALO DE TIEMPO UTILIZADO EN EL SEGUIMIENTO EN LOS RESULTADOS DE LA PREVISIÓN En este capítulo se analiza la influencia del intervalo de tiempo utilizado para
Clasificación Clasific NO SUPERV SUPER ISAD IS A AD AGRUPAMIENTO
Clasificación NO SUPERVISADA AGRUPAMIENTO Clasificación No Supervisada Se trata de construir clasificadores sin información a priori, o sea, a partir de conjuntos de patrones no etiquetados Objetivo: Descubrir
Inteligencia Artificial II (Curso ) Ejercicios propuestos del tema 5
Inteligencia Artificial II (Curso 0-0) Ejercicios propuestos del tema Ejercicio : Diseñar un perceptrón simple con n valores de entrada y función umbral de activación que sirva para calcular la función
Revista Aristas Ciencia Básica y Aplicada
Contenido disponible en http://fcqi.tij.uabc.mx/usuarios/revistaaristas/ Revista Aristas Ciencia Básica y Aplicada ELIMINACIÓN DE LA SOBRESEGMENTACIÓN DE IMÁGENES COLPOSCÓPICAS UTILIZANDO K-MEANS. Itzel
Campos de Markov para Mejorar la Clasificación de Textos
Campos de Markov para Mejorar la Clasificación de Textos Reporte de Proyecto Final Adriana Gabriela Ramírez de la Rosa gabrielarr@inaoep.mx Instituto Nacional de Astrofísica Óptica y Electrónica, 72840
Boosting. Miguel Cárdenas-Montes. 1 Boosting. 2 AdaBoost. Objetivos: Entender como funciona la técnica denominada boosting.
Ó Boosting Miguel Cárdenas-Montes Tanto en clasificación como en regresión, existen estrategias, basadas en la mezcla de modelos, para mejorar la precisión de los modelos. En estos métodos se establece
Análisis de imágenes digitales
Análisis de imágenes digitales SEGMENTACIÓN DE LA IMAGEN Segmentación basada en color INTRODUCCIÓN La segmentación de imágenes a color se puede realizar mediante técnicas de clasificación supervisada.
CAPITULO 5 DISEÑO DE UN CLASIFICADOR DE
Capitulo 5. Diseño de un Clasificador de Patrones. 60 CAPITULO 5 DISEÑO DE UN CLASIFICADOR DE PATRONES. En este capítulo se presenta un problema simple de clasificación de patrones, en el cual se pondrán
Métodos de teoría de Grafos en aprendizaje no supervisado y cl
Métodos de teoría de Grafos en aprendizaje no supervisado y clustering 15 de enero de 2011 1 Teoría de Grafos 2 Métodos de la Teoría de Grafos 3 Clasificación de Documentos Web 4 Clustering Incremental
Ver para aprender y. Eduardo Morales, Hugo Jair Escalante
Ver para aprender y aprender a ver Eduardo Morales, Hugo Jair Escalante Hugo Jair Escalante, Eduardo Morales. Ver para aprender y aprender a ver: sinergias entre aprendizaje automático y visión computacional.
Examen de Teoría de (Introducción al) Reconocimiento de Formas
Examen de Teoría de (Introducción al) Reconocimiento de Formas Facultad de Informática, Departamento de Sistemas Informáticos y Computación Universidad Politécnica de Valencia, Enero de 007 Apellidos:
Extracción de Regiones
Visión por Computadora Unidad V Extracción de Regiones Rogelio Ferreira Escutia Contenido ) Conceptos sobre Regiones 2) Binarización mediante detección de umbral 3) Etiquetado de componentes conexas 4)
Tema 1. Tabulación y representación gráfica de los datos
Tema 1. Tabulación y representación gráfica de los datos Resumen del tema 1.1. Introducción a la Estadística Estadística: ciencia que se ocupa de recoger, clasificar, representar y resumir los datos de
Inteligencia Artificial: Su uso para la investigación
Inteligencia Artificial: Su uso para la investigación Dra. Helena Montserrat Gómez Adorno Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas helena.adorno@iimas.unam.mx 1 Introducción
Segmentación de imágenes biomédicas
Segmentación de imágenes biomédicas Definición de segmentación La segmentación es la partición de una imagen, en un subconjunto regiones homogéneas en base a una característica (intensidad, textura,...).