Tema 2. Preproceso (realzado y filtrado) de imágenes digitales



Documentos relacionados
Fundamentos de la Visión Artificial. Prof. Dr. Francisco Gómez Rodríguez Prof. Manuel J. Domínguez Morales 1

Capitán de fragata ingeniero AGUSTÍN E. GONZÁLEZ MORALES. ÁLGEBRA PARA INGENIEROS (Solucionario)

Operaciones Morfológicas en Imágenes Binarias

Procesamiento de Imágenes

Detección de bordes en una imagen.

Fundamentos de Investigación de Operaciones Investigación de Operaciones 1

TEMA 5 PROCESADO DE IMÁGENES EN EL DOMINIO DE LA FRECUENCIA.

INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA UNIDAD CULHUACÁN INTEGRANTES

Tema 6: Morfología. Primera parte

MEJORA DE LA IMAGEN EN EL DOMINIO DE LA FRECUENCIA: TRANSFORMADA DE FOURIER

CAPÍTULO 3. ALGORITMOS DE PREVISIÓN BASADOS EN LA EXTRAPOLACIÓN DE LOS DATOS MÁS RECIENTES

Este documento ha sido generado para facilitar la impresión de los contenidos. Los enlaces a otras páginas no serán funcionales.

VECTORES. Módulo, dirección y sentido de un vector fijo En un vector fijo se llama módulo del mismo a la longitud del segmento que lo define.

Universidad Nacional de Quilmes Ing. en Automatización y Control Industrial Cátedra: Visión Artificial Agosto de 2005

Tema 2 Límites de Funciones

ÁLGEBRA DE MATRICES. Al consejero A no le gusta ninguno de sus colegas como presidente.

Operaciones morfológicas básicas

CAPÍTULO 3 REVISIÓN DE LA TEORÍA DE WAVELETS

2.2 Transformada de Laplace y Transformada Definiciones Transformada de Laplace

1 Espacios y subespacios vectoriales.

MODELOS DE RECUPERACION

Algebra lineal. Un par de vectores son linealmente dependientes si existe un escalar diferente de cero que asocie ambos vectores, ejemplo: X 2 =k*x 1

CAPITULO I INTRODUCCION. Conforme la informática avanza, las imágenes se han convertido en un área muy

Mecánica Racional 20 TEMA 3: Método de Trabajo y Energía.

Qué es una imágen digital?

Subespacios vectoriales en R n

35 Facultad de Ciencias Universidad de Los Andes Mérida-Venezuela. Potencial Eléctrico

[20380] Visió per Computador Prueba 1 (2015) [A] Teoría (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)

Integrales paramétricas e integrales dobles y triples.

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 09

Tipos de funciones. Clasificación de funciones

CAPÍTULO 6 SIMULACIONES Y RESULTADOS

Aplicaciones Lineales

Sistemas de Generación de Energía Eléctrica HIDROLOGÍA BÁSICA. Universidad Tecnológica De Pereira

Tema 2. Espacios Vectoriales Introducción

Software de Particle Tracking Version 1.0

EXPRESIONES ALGEBRAICAS. POLINOMIOS

BASES Y DIMENSIÓN. Propiedades de las bases. Ejemplos de bases.

Curso de Procesamiento Digital de Imágenes

Capítulo 2. Técnicas de procesamiento digital de imágenes y reconocimiento de patrones.

Matrices Invertibles y Elementos de Álgebra Matricial

FUNCIONES. Funciones. Qué es una función? Indicadores. Contenido

2.1 Sistemas discretos en tiempo Sistemas lineales Sistemas invariantes en tiempo

Matrices: Conceptos y Operaciones Básicas

Definición Dados dos números naturales m y n, una matriz de orden o dimensión m n es una tabla numérica rectangular con m filas y n columnas.

PROBLEMA [1.5 puntos] Obtener la ecuación de la recta tangente en el punto ( 2, 1) a la curva dada implícitamente por y 3 +3y 2 = x 4 3x 2.

Funciones definidas a trozos

MATERIAL 2 EXCEL 2007

NÚMEROS NATURALES Y NÚMEROS ENTEROS

CÁLCULO PARA LA INGENIERÍA 1

Álgebra Vectorial. Principios de Mecánica. Licenciatura de Física. Curso

4.- Para los siguientes conjuntos de vectores, probar si son o no subespacios vectoriales de R 4 : 2d + 1 : b, d reales. d

Tema 4:Segmentación de imágenes

MATEMÁTICAS para estudiantes de primer curso de facultades y escuelas técnicas

APUNTES DE MATEMÁTICAS TEMA 4: VECTORES 1º BACHILLERATO

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Facultad de Ingeniería en Electricidad y Computación SYLLABUS DEL CURSO Procesamiento Digital de Imágenes

GUÍA DE EJERCICIOS UNIDAD II

Un filtro general de respuesta al impulso finita con n etapas, cada una con un retardo independiente d i y ganancia a i.

GUIA DOCENTE DE LA ASIGNATURA VISIÓN ARTIFICIAL DE LA TITULACION MÁSTER DE SISTEMAS TELEMÁTICOS E INFORMÁTICOS

SEGURIDAD EN SISTEMAS DE INFORMACION. TEMA 2 - parte 2. Criptografia asimétrica

Nota 1. Los determinantes de orden superior a 3 se calculan aplicando las siguientes propiedades:

Trabajo, fuerzas conservativas. Energia.

6. VECTORES Y COORDENADAS

FILTRADO DE IMÁGENES

TAREA N 3 OPERADORES DE DETECCIÓN DE BORDES

Capítulo 5. Diseño del modelo de indexación de imágenes basado en una ontología

Sistemas Conexionistas

Matemática 8. Programación dosificada por trimestres

Una desigualdad se obtiene al escribir dos expresiones numéricas o algebraicas relacionadas con alguno de los símbolos

Menús. Gestor de Menús

Nivelación de Matemática MTHA UNLP 1. Vectores

Universidad Nacional de Quilmes Ing. en Automatización y Control Industrial Cátedra: Visión Artificial Septiembre de 2005

Operaciones en el Modelo Relacional. Relacional. Relacional. Índice. Lenguajes de Consulta

8.1. Introducción Dependencia/independencia estadística Representación gráfica: diagrama de dispersión Regresión...

INSTRUCCIONES GENERALES Y VALORACIÓN

PRÁCTICAS CON DERIVE 1 DERIVE 6

Transformada de Fourier

Detección de bordes: metodos lineales de cálculo de gradientesk, etc. Detección de bordes. Métodos basados en operadores lineales de gradiente

Espacios vectoriales y aplicaciones lineales.

1. INVERSA DE UNA MATRIZ REGULAR

Centro de Capacitación en Informática

INSTITUTO VALLADOLID PREPARATORIA página 9

Cálculo científico y técnico con HP49g/49g+/48gII/50g Módulo 3: Aplicaciones Tema 3.7 Polinomio interpolador

3.8 Construcción de una ALU básica

Unidad 5 Utilización de Excel para la solución de problemas de programación lineal

Estructuras algebraicas

Base de datos relacional

UNIDAD 4: PLANO CARTESIANO, RELACIONES Y FUNCIONES. OBJETIVO DE APRENDIZAJE: Representar gráficamente relaciones y funciones en el plano cartesiano.

BREVE MANUAL DE SOLVER

SEÑALES Y ESPECTROS SEÑALES Y ESPECTROS 1

Los números racionales

Anexo 4. Herramientas Estadísticas

TEMA 3 PROFESOR: M.C. ALEJANDRO GUTIÉRREZ DÍAZ 2 3. PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS

Que el estudiante sepa aplicar las principales técnicas que sirven para resaltar características en imágenes

TRANSMISION DIGITAL. PCM, Modulación por Codificación de Pulsos

TEMA 5: HOJAS DE CÁLCULO. Edición de hojas de cálculo con OpenOffice Calc

UNIDAD 4 PROCESOS DE MARKOV

Sistemas de Ecuaciones Lineales y Matrices

TEMA V TEORÍA DE CUADRIPOLOS LINEALES Introducción Parámetros de Impedancia a circuito abierto.

Tema 1. Operaciones y elementos de simetría. Objetivos:

Transcripción:

Tema 2. Preproceso (realzado y filtrado) de imágenes digitales - Introducción - Procesamiento básico de imágenes - Histograma y realzado de imágenes - Filtrado en el dominio de la frecuencia - Filtrado en el dominio espacial - Filtros morfológicos

Bibliografía BÁSICA: R.C. González y R.E. Woods, Digital Image Processing, Prentice Hall, 2ª Edición, 22. (caps. 3 y 4) J. Vélez, Á. Sánchez, A.B. Moreno y J.L. Esteban, Visión por Computador, Ed. Dyckinson y Serv. Public. URJC, 23. (caps. 3) COMPLEMENTARIA: G. Pajares y J.M. de la Cruz, Visión por Computador, Ed. Ra- Ma, 2. (caps. 2 y 6) M. Sonka et al., Image Processing, Analysis, and Machine Vision, PWS Publishing, 999. (cap. 4)

Introducción El objetivo del preproceso es conseguir algoritmos que mejoren la calidad y/o la apariencia de la imagen original. Se resaltan ciertas características de una imagen (bordes, contraste, ) y se ocultan o eliminan otras (p. ej. ruido) Etapa previa necesaria para otras fases posteriores de análisis (segmentación, extracción de características, reconocimiento e interpretación). Principales tipos de preproceso: realzado y filtrado. Algoritmos en el dominio espacial y en dominios transformados (p. ej. transformada de Fourier).

Procesamiento básico de imágenes (I) Operaciones a nivel de píxel, que pueden ser: aritméticas, lógicas, de umbralización y geométricas Operaciones aritméticas entre los píxeles de dos imágenes: c(x,y) = f A (a(x,y), b(x,y)), x M, y N. Tipos: Suma, resta, multiplicación y división Problemas de desbordamiento reescalar resultado Aplicación suma: Reducción ruido de la imagen Aplicación resta: Estudio del movimiento (entre imágenes consecutivas de una secuencia)

Procesamiento básico de imágenes (II) Operaciones lógicas: Aplicables a imágenes binarias (que pueden obtenerse mediante umbralización de una imagen de grises) Tipos: not, or, and, xor Operaciones relacionales: <, >,,, max, min,... Aplicaciones: uso en imágenes binarias como máscaras para detección de características y para análisis de formas.

Procesamiento básico de imágenes (III) Ejemplos de operaciones aritméticas y lógicas sobre imágenes en niveles de gris. A B -A A or B A and B (A+B)/2 max(,a-b) Los píxeles negros corresponden al nivel de gris y los píxeles blancos al 255.

Procesamiento básico de imágenes (IV) Umbralización ( thresholding ). Permite crear una imagen binaria a partir de una imagen de grises a partir de un nivel de umbral U. B(i,j) =, si I(i,j) U B(i,j) =, si I(i,j) < U U =27

Procesamiento básico de imágenes (V) Operaciones geométricas: Modifican las relaciones espaciales entre píxeles de una imagen Tipos: traslación, escalado y rotación Matrices de transformación (uso de coordenadas homogéneas) Composición de transformaciones Puede ser necesario combinarlas con un algoritmo de interpolación (necesidad de coordenadas enteras)

Procesamiento básico de imágenes (VI) Matrices de transformaciones geométricas: = ' ' y x s s y x y x = ' ' y x d d y x y x = ) cos( ) sen( ) sen( ) cos( ' ' y x y x θ θ θ θ Traslación Escalado Rotación

Procesamiento básico de imágenes (VII) Ejemplo de rotación. (a) imagen original que se desea rotar entorno al punto P de coordenadas (x,y). (b) resultado de la primera traslación. (c) resultado del giro. (d) resultado final (-x,-y) (x,y) θ (a) (b) (c) (d) P Ejemplo de composición de transformaciones geométricas. T x,y R θ T -x,-y =F + = ) ( )) cos( ( ) cos( ) ( ) ( )) cos( ( ) ( ) cos( ) cos( ) ( ) ( ) cos( θ θ θ θ θ θ θ θ θ θ θ θ xsen y sen ysen x sen -y -x sen sen y x

Histograma y realzado de imágenes (I) El histograma de una imagen es una representación gráfica de la frecuencia con la que los niveles de gris aparecen en ella. Herramienta fundamental para el análisis de imágenes digitales. Permite condensar información sobre la imagen (probabilidades de cada nivel de gris) pero se pierde la localización espacial. Su rango dinámico es el conjunto de niveles de gris presentes. 2 puntos (negro) Niveles intermedios de gris 255 (blanco)

Histograma y realzado de imágenes (II) Las modificaciones del histograma se pueden visualizar mediante funciones de transferencia, que corresponden a curvas acotadas en abscisas y ordenadas entre y..5.5.5.5.5.5 Cuadrado Raíz cuadrada Lineal Operaciones de realzado: aumento del contraste y ecualización del histograma.

Histograma y realzado de imágenes (III) (a) (b) (c) Transformaciones del histograma: (a) imagen original y su histograma; (b) resultado de una operación de disminución de contraste; (c) resultado de aumentar el contraste.

Histograma y realzado de imágenes (IV) La ecualización tiene por objetivo obtener un nuevo histograma, a partir del original, con una distribución uniforme de los diferentes niveles de intensidad. Para todos los niveles de gris se tiene el mismo número de píxeles mejora la apariencia visual de la imagen. Para que la ecualización sea útil toda la imagen debe reunir las mismas propiedades (imagen clara u oscura). Ecualización por ventanas.

Filtrado en el dominio de la frecuencia (I) Un filtro puede verse como un mecanismo de cambio o transformación de una señal de entrada a la que se le aplica una función, conocida como función de transferencia, para obtener una señal de salida. Todas estas señales y funciones pueden ser discretas o continuas, y aunque en el tratamiento de imágenes se usan señales y funciones discretas. E H S Filtro discreto con entrada E, salida S y función de transferencia H.

Filtrado en el dominio de la frecuencia (II) Las representaciones en el dominio de la frecuencia, en base a explicar cómo se repiten los píxeles de una imagen, consiguen representar la información de tal imagen. Esta representación es especialmente útil, ya que teniendo la frecuencia de repetición de los elementos que componen una imagen, se pueden apreciar y alterar directamente elementos como el ruido, los bordes, las texturas, etc. Transformadas en el dominio de la frecuencia usadas en tratamiento de imágenes: Transformada de Fourier (funciones base: senos y cosenos) Transformada del coseno (funciones base: cosenos) Transformadas wavelet (funciones base: Haar, Daubechies,...) Transformada de Karhaunen-Loeve o Análisis de Componentes Principales (PCA)

Filtrado en el dominio de la frecuencia (IV) Transformada de Fourier. Una serie de Fourier puede considerarse como la suma de un conjunto de funciones sinusoidales de diferentes frecuencias, promediada por unos coeficientes, con el objetivo de aproximarse a una función f(x). Una función periódica en el tiempo, de periodo To (T =2π/ω ), puede expresarse como: f ( x) = a + ( a cos kω x + b sen kω x k k ) k= Estos coeficientes evalúan qué peso tiene cada una de las funciones sinusoidales a la hora de construir la función f(x). El conjunto de señales sinusoidales (senos y cosenos), constituye una base de funciones en el dominio de la frecuencia. La transformada de Fourier de una función f(x) es una extensión de las series de Fourier a señales no periódicas. F j u = f x e 2 πux (transformada ( ) ( ) dx f ( x) directa) j2πux = F( u) e du (transformada inversa)

Filtrado en el dominio de la frecuencia (IV ) Transformada de Fourier.

Filtrado en el dominio de la frecuencia (V) Transformada discreta de Fourier. Una señal discreta o muestreada es aquélla constituida por un conjunto finito de valores: F = {f(), f(),... f(n-)}. Modificaciones con respecto a la transformada continua: ) Integrales por sumatorios. 2) Cambio de variable sobre los coeficientes (a n, b n ), para que la función se defina en un intervalo general [,N-] en vez de en el intervalo: [-, ]. 3) Se puede utilizar la fórmula de Euler a fin de encontrar una notación más compacta, transformado el coeficiente (a n, b n ) en un número complejo.

Filtrado en el dominio de la frecuencia (VI) Transformada discreta de Fourier. Para una señal temporal f(x) la transformada discreta de Fourier es: F( u) = N N x= f ( x) e 2π j ux N =,,..., N siendo u la frecuencia de la señal transformada. Se ha pasado de tener una señal discreta en el dominio del tiempo: f = {f(), f(),... f(n-)}, a tener una señal discreta en el de la frecuencia: F = {F(),F(),..., F(N-)}. Transformada discreta inversa de Fourier: u f ( x) = N u= F( u) e 2π j ux N x =,,..., N

Filtrado en el dominio de la frecuencia (VII) Transformada rápida de Fourier (FFT) La primera optimización es calcular la exponencial fuera del sumatorio. Se precalcula la parte exponencial de la fórmula y se almacena en un array PRE. La segunda optimización se basa en calcular por separado los términos pares e impares de la serie de Fourier. Esta optimización hace que para el cálculo de un término de la serie sean necesarias sólo N/2 sumas frente a N. Por último, si el número de valores N de la función a aproximar es 2 k, la idea de calcular de manera independiente términos pares e impares se puede aplicar de manera sucesiva (algoritmo de divide y vencerás ).

Filtrado en el dominio de la frecuencia(viii) Transformada de Fourier para imágenes F( u, v) = I( f ( x, y)) = MN M N x= y= f ( x, y) e ux vy j2π ( + ) M N para: u =,, 2,,M- y v =,, 2,, N- (a) (b) (c) Imagen de Lena (a) sobre la que se realiza una transformada de Fourier. (b) y (c) corresponden, respectivamente, a la representación matricial de los módulos y de las fases de los coeficientes de Fourier normalizados entre y y en falso color.

Filtrado en el dominio de la frecuencia (IX) Transformada de Fourier para imágenes La matriz de módulos de coeficientes F(u,v) contiene información relativa a los valores de intensidad de la imagen (amplitudes de las sinusoides). La matriz de fases φ(u,v) contiene la información relativa a la posición de los píxeles (posición de los flancos de subida y bajada de las sinusoides). Transformada inversa de Fourier de una imagen discreta: f ( x, y) = I ( F( u, v)) = M N u= para: x =,,, M- e y =,,, N- Si se realiza la transformada inversa usando sólo la matriz de fases se obtiene una imagen parecida al trazado de bordes de la imagen original. La transformada inversa usando sólo la matriz de módulos proporciona una imagen de manchas con tonos parecidos a los de la original. v= F( u, v) e j2π ( ux M vy + ) N

Filtrado en el dominio de la frecuencia (X) Propiedades de la transformada de Fourier 2D Separabilidad: El cálculo de una transformada de Fourier 2D (y de su inversa) puede realizarse como dos transformaciones D de Fourier aplicadas sucesivamente. Traslación: f(x,y)exp(2πj(u x+v y)/n) F(u-u,v-v ) f(x-x, y-y ) F(u,v) exp(-2πj(ux + v y )/N) Periodicidad: F(u,v) = F(u+N,v) = F(u,v+N) = F(u+N,v+N) Rotación:Rotando f(x,y) por un ángulo θ se rota F(u,v) por el mismo ángulo. Distributividad : La transformada de Fourier y su inversa son distributivas con respecto a la adición pero no con respecto a la multiplicación. Escalado: Valor medio: Si a f(x,y) a F(u,v) f(ax,by) F(u/a,v/b) / ab m = N N f ( x, y ) 2 x = y = N entonces: m=f(,)

Filtrado en el dominio de la frecuencia (XI) Transformada de Fourier para imágenes Filtros paso bajo. Eliminan altas frecuencias, dejando pasar bajas frecuencias (aquéllas por debajo una frecuencia de corte) Se ponen a cero los módulos de los coeficientes de Fourier relativos a las altas frecuencias, dejando sin modificar los relativos a las bajas frecuencias. (a) (b) (c) Resultado de la transformada inversa sobre la matriz de coeficientes modificadas

Filtrado en el dominio de la frecuencia (XII) Transformada de Fourier para imágenes Filtros paso alto. Eliminan bajas frecuencias, dejando pasar altas frecuencias. Se ponen a cero los módulos de los coeficientes de Fourier relativos a las bajas frecuencias, dejando sin modificar los relativos a las altas frecuencias. (a) (b) (c) Resultado de la transformada inversa sobre la matriz de coeficientes modificadas

Filtrado en el dominio de la frecuencia (XIII) Transformada de Fourier para imágenes Filtros paso banda. Permanece inalterada una banda (o rango) de frecuencias, Eliminación de ruido estructural usando un filtrado paso banda

Filtrado en el dominio de la frecuencia (XIV) Wavelets Las wavelets son funciones que cumplen ciertas propiedades matemáticas y se usan para representar datos y otras funciones. Permiten procesar datos a diferentes escalas o resoluciones. El análisis de wavelets consiste en la descomposición de una señal arbitraria f en versiones escaladas y trasladadas de la wavelet original. Para analizar (y aproximar) funciones usando wavelets se usa algún prototipo de función base o wavelet madre (Haar, Daubechies, ) Se emplearon inicialmente (Morlet, 984) para analizar señales donde sus componentes de alta frecuencia ocurrían en intervalos cortos de tiempo mientras que las componentes de baja frecuencia aparecían durante más tiempo.

Filtrado en el dominio de la frecuencia (XV) Wavelets Como la señal o función original se puede expresar mediante una combinación lineal de funciones wavelet, solo se requieren los coeficientes de dicha expansión. Aplicaciones sobre imágenes: Compresión Filtrado Edición multirresolución Búsqueda por contenido, Similitudes entre las transformadas de Fourier y de wavelets: Transformaciones lineales Funciones base localizadas en frecuencia Propiedades matemáticas similares de las matrices de ambas transformaciones

Filtrado en el dominio de la frecuencia (XVI) Wavelets Diferencias entre las transformadas de Fourier y de wavelets: En la transformada de Fourier las funciones base son senos y cosenos; en las transformadas de wavelets las funciones de base son más complejas podemos además tener diferentes tipos de funciones de base). En Fourier, las funciones base no tienen soporte compacto; las wavelets, sí. Las funciones de base wavelets están localizadas espacialmente (además de en frecuencia); las de Fourier, solo en frecuencia. En el plano tiempo-frecuencia, para Fourier todas las ventanas son iguales (la resolución del análisis es la misma en todas las posiciones); en la transformada wavelet, al variar el tamaño de las ventanas (dado por las funciones de base), podemos realizar una análisis a distintas resoluciones.

Filtrado en el dominio de la frecuencia (XVII) Transformada wavelet Latransformada wavelet continua de una función f(x) es: c m, n f ( x) Ψm, n( x) = dx donde {Ψ m,n (x)} es una familia de bases reales y ortonormales obtenidas mediante escalado (por m) y traslación (por n) de una función Ψ(x) llamada wavelet madre: Ψ m m / 2 m, n( x) = 2 Ψ(2 x n) La función original se puede reconstruir a partir de los coeficientes c m,n (transformada inversa wavelet): f ( x) = c m Ψ ( x m, n, n m, n )

Filtrado en el dominio de la frecuencia (XVIII) Transformada wavelet Para realizar el análisis multirresolución, se necesita: la wavelet madre Ψ(x) y unas funciones de escalado (y translación) {φ m,n (x)}: m / 2 m φm, n( x) = 2 φ(2 x n) donde φ(x) es una función de escalado base. Las funciones de escalado definen aproximaciones groseras de una función (a diferentes niveles de resolución) y las funciones wavelets codifican el detalle (diferencia entre aproximaciones adyacentes). Sean V j =Span{φ j,n (x)} y W j =Span{Ψ j,n (x)}, los subespacios generados por las funciones base de escalado y wavelet, respectivamente, para un nivel de resolución j (para todo valor de n). Se cumple que: V j+ =V j W j donde denota la unión de subespacios. Se cumple que todos los elementos de V j son ortogonales a los de W j

Filtrado en el dominio de la frecuencia (XIX) Transformada wavelet A su vez, cualquier función φ(x) y Ψ(x) pueden ser expresadas mediante las ecuaciones (al ser estos espacios generados por las funciones de escalado de resolución inmediatamente superior): φ( x) = Ψ( x) = 2 2 k k h φ h ( k) φ(2x k) Ψ ( k) Ψ(2x k) donde solo se requieren los coeficientes h φ (k) y h Ψ (k) para realizar la transformada wavelet. Estos coeficientes está relacionados por la siguiente ecuación: h Ψ k ( k) = ( ) h ( k) φ

Filtrado en el dominio de la frecuencia (XX) Transformada wavelet de Haar Unas funciones de escalado {φ m,n (x)} y de wavelets {Ψ m,n (x)} muy usadas son las de Haar., si : x <.5, si : x < φ( x) = Ψ( x) =, si :,5 x <, e. o. c., e. o. c. La transformada de Haar es separable y para ella existen implementaciones de complejidad lineal. En ella al ser, además, ortonormales, las bases de funciones a distintos niveles de resolución, se tiene que la imagen transformada conserva la energía de la imagen original.

Filtrado en el dominio de la frecuencia (XXI) Transformada wavelet de Haar Distintas wavelets de Haar: L 2 (R)=Vj Wj Wj siendo j una escala arbitraria de comienzo.

Filtrado en el dominio de la frecuencia (XXII) Transformada wavelet de Haar Reconstrucción de y=x 2 usando la expansión mediante series de wavelets de Haar

Filtrado en el dominio de la frecuencia (XXIII) Transformada wavelet para imágenes Al igual que en Fourier, se pueden definir las transformadas wavelet discreta (DWT) y rápida (FWT). Existen diversas formas de generalizar las transformadas wavelet D a 2D para poder ser empleadas en imágenes. Se necesita una función de escalado 2D φ(x,y) y tres de wavelets 2D: Ψ H (x,y), Ψ V (x,y) y Ψ D (x,y), que son separables: φ(x,y)=φ(x)φ(y), Ψ H (x,y)=ψ(x)φ(y), Ψ V (x,y)=φ(x)ψ(y), Ψ D (x,y)=ψ(x)ψ(y) Ahora las funciones de base 2D son: j / 2 j j φ j, m, n( x, y) = 2 φ(2 x m,2 y n) i j / 2 i j j Ψ ( x, y) = 2 Ψ (2 x m,2 y n) j, m, n siendo: i = {H,V,D}.

Filtrado en el dominio de la frecuencia (XXIV) Transformada wavelet para imágenes La generalización de las transformadas wavelet D a 2D para poder ser empleadas en imágenes se puede realizar eficientemente (usando la forma de la FWT): La idea es ir alternando la transformada wavelet unidimensional (p.ej. la de Haar) sobre las filas y sobre las columnas de la imagen, obteniéndose una región que contiene los coeficientes con los valores medios de la señal (coeficientes de análisis) y tres regiones con los coeficientes de detalle horizontales verticales y diagonales. Posteriormente se aplica el mismo procedimiento sobre la región de coeficientes con los valores medios. = = Ψ Ψ + = D V H i j j i n m j m n i n m j m n y x n m j W MN y x n m j W MN y x f,,,,,, ), ( ),, ( ), ( ),, ( ), ( φ φ

Filtrado en el dominio de la frecuencia (XXV) Transformada wavelet para imágenes Descomposición resultante de la FWT en 2D

Filtrado en el dominio de la frecuencia (XXVI) Transformada wavelet para imágenes FWT en 2D (fase de análisis)

Filtrado en el dominio de la frecuencia (XXVII) Transformada wavelet para imágenes FWT en 2D (fase de síntesis)

Filtrado en el dominio de la frecuencia (XXVIII) Transformada wavelet para imágenes Imagen original nivel j (resolución 256 256) y su descomposición j-2 usando wavelets de Haar (resolución 64 64).

Filtrado en el dominio de la frecuencia (XXIX) Transformada wavelet para imágenes: filtrado

Filtrado en el dominio de la frecuencia (XXX) Transformada wavelet para imágenes: compresión

Filtrado en el dominio espacial (I) Técnicas que operan directamente con los valores de los píxeles de la imagen. Se puede demostrar matemáticamente que la transformación al dominio de la frecuencia (F), la aplicación del filtro (H) sobre los coeficientes, y la aplicación de la inversa de la transformada (F - ), se puede realizar directamente en el dominio espacial. Esta operación se conoce como convolución (*) y exige el conocimiento de la transformada inversa del filtro (h), que se conoce como función impulsional. I'( x, y) = I( x, y)* h( x, y) = N 2 N N i= j= 2 2 La carga computacional de esta operación se reduce usando una función de transferencia h que tenga un número de elementos muy inferior a NxN. Estas funciones impulsionales reducidas se llaman funciones de filtrado espacial. N 2 I( i, j) h( x i, y j)

Filtrado en el dominio espacial (II) Proceso de convolución espacial aplicado al píxel I(x,y) creando como resultado el píxel de la posición O(x,y).

Filtrado en el dominio espacial (III) Filtro espacial paso bajo. El filtrado espacial lineal paso bajo se basa en el promediado de los píxeles adyacentes al píxel que se evalúa. Se usa para quitar ruido y eliminar pequeños detalles de la imagen. El filtro paso bajo más simple que se puede diseñar es una matriz de 3x3 con todos los elementos a. Otros filtros de paso bajo: 9 = 2 h = 2 2 4 2 2 6 h

Filtrado en el dominio espacial (IV) Filtro espacial paso alto. El filtrado espacial lineal paso alto se usa para resaltar el detalle fino de la imagen o para recuperar cierto detalle perdido durante su captura. El detalle (información) de una imagen está en los bordes (valores de altas frecuencias) que son aquellos píxeles alrededor de los cuales la imagen presenta una variación brusca en los niveles de gris. Las derivadas (primera y segunda) de una imagen I(x,y) informan de cómo se producen los cambios de intensidad en la misma. Primera derivada: operador gradiente. I r ( I( x, y)) = u + x Segunda derivada: operador laplaciana. I r y x u y Δ( I( x, y)) = 2 ( I( x, y)) = 2 x I 2 r u 2 I + y r x u 2 y

Filtrado en el dominio espacial (V) Filtro espacial paso alto: operadores de primera derivada. El gradiente de una imagen I(x,y) en un punto (x,y) se define como un vector bidimensional apuntando en la dirección de variación máxima de I en (x,y). La magnitud del vector (I(x,y)) es: y su dirección es: -Máscara 3 3 para operador de Sobel: 2 2 y x y x + + = = x y tan y x ), α( = 2 2 4 x = 2 2 4 y

Filtrado en el dominio espacial (VI) Filtro de Sobel en la dirección y : Otros filtros basados en el gradiente: = 2 2 4 y = 3 x = 3 y Prewitt: Roberts: = x = y

Filtrado en el dominio espacial (VII) Filtro espacial paso alto: operadores de segunda derivada. La laplaciana es la segunda derivada de una función; al igual que el operador de gradiente puede implementarse de diferentes formas. Este operador se hace cero cuando la primera derivada se hace máximo. El requerimiento básico al definir la laplaciana de forma digital es que el coeficiente asociado con el píxel central sea negativo(o positivo) y los asociados con otros píxeles sean positivos (o negativos). Ejemplo de aplicación de la laplaciana: 4 4 8 8 (4-vecinos) (8-vecinos)

Filtros morfológicos (I) Técnica de análisis de imágenes basada en la geometría y la forma. Las operaciones morfológicas (que son filtros no lineales) simplifican las imágenes y las formas de los objetos. Aplicaciones: suavizar bordes de regiones, separar regiones unidas o unir regiones separadas tras la segmentación, contar el número de regiones en una imagen, etc. Aplicable a imágenes binarias y en niveles de gris. Operaciones básicas: erosión, dilatación, apertura y cierre. Operaciones derivadas: esqueletización, adelgazamiento, ensanchado, granulación,...

Filtros morfológicos (II) Morfología binaria El lenguaje de la morfología matemática es la teoría de conjuntos. Los conjuntos en morfología matemática representan las formas de los objetos en una imagen. Las imágenes binarias se pueden considerar subconjuntos del espacio Z 2. Las imágenes de niveles de grises, subconjuntos de Z 3.

Filtros morfológicos (III) Morfología binaria: operaciones básicas Dilatación. Sean A y B dos conjuntos en Z 2, la dilatación de A con B, denotada como A B, se define: A B = {c Z 2 c = a + b, para algún a A y b B} El elemento B es el elemento que dilata a A, y se conoce como elemento estructurante de la dilatación. Ejemplo: A B A B

Filtros morfológicos (IV) Morfología binaria: operaciones básicas Erosión. Sean A y B dos conjuntos en Z 2, la erosión de A con B, denotada como AΘB, se define: AΘB = {x Z 2 x + b A y b B} Ejemplo: A B A B

Filtros morfológicos (V) Morfología binaria: operaciones básicas Apertura. Se define como: A B = (A Θ B) B Cierre. Se define como: A B = (A B) Θ B Ejemplos: A B A B A B

Filtros morfológicos (VI) Morfología binaria: operaciones básicas

Filtros morfológicos (VII) Morfología binaria: operaciones básicas Ejemplos (Imagen de Lenna con elemento estructurante de 3 3): Imagen binaria Dilatación Erosión Apertura Cierre