Escuela Técnica Superior de Ingenieros Proyecto Fin de Carrera Comparativa de clasificadores para la detección de microaneurismas en angiografías digitales. DEPARTAMENTO DE TEORÍA DE LA SEÑAL Y COMUNICACIONES Autor: Santiago Pavón Ruiz Tutora: Begoña Acha Piñero Sevilla, Junio 2.005
Índice ÍNDICE CAPITULO 1: INTRODUCCIÓN 3 CAPITULO 2: RETINOPATÍA DIABÉTICA 6 2.1 INTRODUCCIÓN 7 2.2 DIABETES MELLITUS 7 2.3 DIABETES OCULAR 8 2.4 RETINOPATÍA DIABÉTICA 11 2.4.1 Introducción 11 2.4.2 Patogenía 12 2.4.3 Evolución y cuadros clínicos 13 2.4.4 Signos clínicos 29 2.4.5 Tratamiento 32 2.4.6 Factores de riesgo 37 CAPITULO 3: ALGORTIMO DE DETECCIÓN 38 3.1 INTRODUCCIÓN 39 3.2 CARACTERÍSTICAS DE LA IMAGEN ORIGINAL 39 3.3 BLOQUE DE PREPROCESADO 41 3.3.1 Filtro de media 42 3.3.2 Sustracción 45 3.3.3 Escalado de intensidad 46 3.3.4 Filtro morfológico Top-hat 47 3.4 BLOQUE DE DETECCIÓN 48 3.5 BLOQUE DE SEGMENTACIÓN 50 CAPITULO 4: CLASIFICADORES 52 4.1 INTRODUCCIÓN 53 4.2 DESCRIPTORES 53 4.3 SELECCIÓN DE CARACTERÍSTICAS 55 4.4 CLASIFICADOR EMPÍRICO DE IRIS 3.0 57 4.4.1 Criterio de intensidad 57 4.4.2 Criterio de forma 57 4.4.3 Criterio de tamaño 58 4.5 RED FUZZY-ARTMAP 58 4.5.1 Redes neuronales artificiales 59 4.5.2 Redes ART 60 4.5.3 Arquitectura ART1 61 4.5.4 Arquitectura ARTMAP 66 4.5.4.1 Arquitectura ARTMAP simple 67 4.5.4.2 Arquitectura ARTMAP general 71 4.5.4.3 Propiedades de ARTMAP 72 4.5.5 Arquitectura Fuzzy-ART 73 4.5.6 Arquitectura Fuzzy-ARTMAP 78 4.6 MÁQUINA DE VECTORES SOPORTE 82 4.6.1 Cota para la generalización del rendimiento de una máquina de aprendizaje de reconocimiento de patrones 82 4.6.1.1 La dimensión VC 83 4.6.1.2 Separación de puntos con hiperplanos orientados en R n 84 4.6.1.3 Relación entre la dimensión VC y el número de parámetros 85 4.6.1.4 Minimizar la cota minimizando h 86 1
Índice 4.6.1.5 Minimización estructural del riesgo (SRM) 86 4.6.2 Máquinas de vectores soporte lineales 87 4.6.2.1 El caso separable 87 4.6.2.2 Las condiciones de Karush-Kuhn-Tucker (KKT) 89 4.6.2.3 Fase de validación 90 4.6.2.4 El caso no separable 90 4.6.3 Máquinas de vectores soporte no lineales 93 4.6.3.1 Condición de Mercer 95 4.6.3.2 Algunos ejemplos de núcleos usados en el caso no lineal 96 4.6.4 Métodos de solución 97 4.6.5 La dimensión VC de las SVMs 97 4.6.6 Características 98 4.6.7 Implementación 99 CAPITULO 5: RESULTADOS 100 5.1 INTRODUCCIÓN 101 5.2 MATERIAL 101 5.3 MÉTODO 102 5.3.1 Curva de operación característica del receptor (ROC) 102 5.3.2 Obtención curva ROC con el clasificador de Iris 3.0 106 5.3.3 Obtención curva ROC con Fuzzy-ARTMAP 106 5.3.4 Obtención curva ROC con SVM 106 5.4 RESULTADOS 107 5.4.1 Selección de parámetros de los clasificadores 107 5.4.2 Selección de características 108 5.4.3 Curva ROC del clasificador de Iris 3.0 113 5.4.4 Curva ROC de los clasificadores basados en Fuzzy-ARTMAP 114 5.4.5 Curva ROC de los clasificadores basados en SVM 118 5.4.6 Resultados de la comparación usando curvas ROC 120 5.4.7 Resultados de la comparación usando otras medidas 120 5.5 EJEMPLO 129 CAPITULO 6: CONCLUSIONES Y LÍNEAS FUTURAS 135 6.1 CONCLUSIONES 136 6.2 LÍNEAS FUTURAS 136 REFERENCIAS 138 AGRADECIMIENTOS 142 2
Capitulo 1: Introducción CAPITULO 1 INTRODUCCIÓN 3
Capitulo 1: Introducción Debido a la naturaleza propia del ser humano, este siempre ha investigado para tratar de descubrir lo desconocido y de mejorar su calidad de vida aplicando para ello su ingenio. De esta forma la ciencia ha ido evolucionando en el transcurso del tiempo, llegando hasta nuestros días, dando como fruto miles de herramientas, desde la rueda hasta los más sofisticados satélites. Los proyectos de investigación son aquellos cuyo objetivo es la obtención de nuevos conocimientos generales, científicos o técnicos. Estos nuevos conocimientos deben suponer un avance en el ámbito en el que se encuadren (proyectos de investigación básica) y, en su caso, resultar de utilidad para la creación o mejora de productos, procesos o servicios (proyectos de investigación aplicada). El campo de la medicina es uno de los más importantes para la investigación y desarrollo de nuevas ideas, ya que repercute directamente en nuestra calidad de vida. Una de estas ayudas en la medicina son las herramientas de diagnóstico CAD (Computer Aided Diagnostic), las cuales intentan servir como apoyo al médico en el diagnóstico de enfermedades. Este proyecto trata de ayudar al diagnóstico de la retinopatía diabética [López Gálvez, 2000]. La retinopatía diabética es una complicación ocular de la diabetes, la cual puede llegar a producir ceguera, aunque se puede evitar si se detecta la enfermedad a tiempo y se trata adecuadamente. Una de las principales herramientas en la que se apoya el médico para la evaluación de la enfermedad es la angiografía de retina digitalizada o angiografía fluoresceínica. Se trata de una imagen digital de la retina en la que se muestra el contraste entre la circulación sanguínea y el fondo. Al tratarse de una imagen digital se obtienen varias ventajas, de las que podemos destacar la posibilidad de ser tratadas usando distintos algoritmos que nos ayuden a mejorarlas o a interactuar con ellas. Cuando la retinopatía llega a un estado avanzado el único tratamiento eficaz es la utilización de láser que es un tratamiento altamente agresivo que provoca pérdida de visión. De ahí la importancia de crear un software específico que ayude en la detección de los primeros síntomas de la enfermedad, los microaneurismas, que son pequeños puntos redondos que se pueden detectar fácilmente en las angiografías fluoresceínicas. Este software lo ha ido desarrollando el Departamento de Teoría de la Señal y Comunicaciones de la Escuela Superior de Ingenieros de la Universidad de Sevilla en distintos proyectos, su última versión, denominada Iris 3.0, desarrollada por Alejandro Garzón, ingeniero de telecomunicación de la Universidad de Sevilla, en el proyecto fin de carrera Mejoras de algoritmos para detección de microaneurismas sobre angiografías de retina digitalizadas [Garzón, 2004] es la base de nuestro proyecto. Además contamos con un banco de imágenes de angiografías fluoresceínicas proporcionado por el Dr. Arriaga, miembro del Servicio de Oftalmología del Hospital Universitario Virgen del Rocío de Sevilla. Nuestro proyecto trata de hacer un estudio comparativo entre distintos clasificadores y el clasificador utilizado en Iris 3.0. Partiendo de los candidatos a 4
Capitulo 1: Introducción microaneurismas seleccionados por Iris 3.0, se han aplicado distintos clasificadores para decidir si realmente el candidato representa un microaneurisma o no. Para el estudio comparativo hemos escogidos algunos de los sistemas de clasificación que han demostrado mejores prestaciones en aplicaciones parecidas a la nuestra. Se trata de una red neuronal tipo Fuzzy-ARTMAP [Carpenter, 1992] y de una máquina de soporte vectorial (SVM) [Vapnik, 1995]. Para la comparación entre los distintos clasificadores hemos usado una herramienta muy útil en la evaluación de procederes diagnósticos como es el análisis de las curvas de operación característica del receptor (Receiver-Operating Characteristic (ROC)) [Domínguez Alonso, 2002]. Estas curvas no son más que la representación de la sensibilidad frente a la especificidad del clasificador para todos los posibles valores del umbral de decisión. Por ello las curvas ROC son útiles para la comparación de distintos procederes diagnósticos y la selección de umbrales de decisión. Hay que tener en cuenta que el diagnóstico es una parte crítica en el proceso clínico, ya que una estrategia diagnóstica equivocada pone en riesgo al paciente y ocasiona grandes pérdidas de recursos, por lo que vemos la importancia de tener un buen diagnóstico. Este proyecto consta de 6 capítulos. En el segundo capítulo se explica con un poco más de detalle la retinopatía diabética describiendo sus síntomas y las principales características de los microaneurismas que nos pueden ser útiles para su clasificación. En el tercer capítulo se expone el algoritmo del proyecto Iris 3.0 explicando sus distintas partes y procedimientos para la obtención de los candidatos a microaneurismas. El cuarto capítulo explica los distintos clasificadores que se van a comparar, su origen, como funcionan y como vamos a implementarlos. El quinto capítulo presenta los resultados obtenidos para el material del que disponemos, es decir, las 23 imágenes validadas por los especialistas (Gold Standard), así como se describe el método usado para la comparación de los distintos clasificadores, las curvas ROC. El último capítulo trata de exponer las conclusiones a las que hemos llegado y las posibles líneas futuras de trabajo para la mejora del proyecto en sí. 5