Análisis de imágenes digitales REPRESENTACIÓN Y DESCRIPCIÓN Momentos
INTRODUCCIÓN En general, la relación entre una imagen ideal f(x,y) y una imagen observada g(x,y) se describe como g =D( f ) donde D es un operador de degradación. El operador D puede ser descompuesto en degradación radiométrica R (i.e., color o escala de grises) y en degradación geométrica G (i.e., espacial). Distorción de perspectiva debido a una vista no perpendicar Imagen borrosa por mal enfoque de la cámara 2 Imagen distorcionada por una deformación no lineal
INTRODUCCIÓN El reconocimiento de objetos y patrones que han sido deformados es el objetivo de muchas investigaciones. Básicamente las tres mayores aproximaciones a este problema son: 1. Fuerza bruta: se busca en el espacio paramétrico todas las posibles degradaciones de la imagen, esto significa que el conjunto de entrenamiento no sólo contiene todas las clases representativas sino todas sus versiones escaladas, rotadas y deformadas. 2. Normalizada: los objetos se transforman a un estándar específico de posición antes de realizar la clasificación. 3. Invariantes: describir los objetos a través de un conjunto de rasgos cuantificables que sean insensibles a cualquier tipo de deformación y que provea gran poder de discriminación entre clases. 3
INVARIANTES Un invariante I es una funcional definida en el espacio de todas las imágenes admisibles que no cambia su valor bajo la degradación del operador D, es decir, satisface la condición I( f ) = I(D( f )) para imagen f. En la práctica, debido a las imperfecciones en el método de segmentación, el ruido y variaciones intra-clase I( f ) I(D( f )). Espacio de invariantes Otra propiedad importante deseable de I es el poder de discriminación, de manera que para objetos diferentes, sus valores deben ser significativamente diferentes. x 1 x 2 4
INVARIANTES Categorización de los invariantes de acuerdo a la herramienta matemática empleada: Descriptores de formas simples: compacidad, convexidad, elongación, etc. Invariantes Características de coeficientes de transformadas: descriptores de Fourier, descriptores Hadamard, coeficientes de la transformada Radon y características basadas en wavelets. Conjunto de puntos invariantes: usa la posición de puntos dominantes. Invariantes diferenciales: emplea derivativas de contorno del objeto. Momentos invariantes: funciones especiales de los momentos de una imagen. 5
MOMENTOS Los momentos son proyecciones de una función sobre una base polinomial, de manera similar que la transformada de Fourier es una proyección sobre una base de funciones harmónicas. Se han utilizado por mucho tiempo en estadística para describir la forma de una función de densidad de probabilidad y en mecánica clásica para medir la distribución de masa de un cuerpo. Los momentos invariantes aplicados al procesamiento de imágenes y reconocimiento de patrones comenzaron a utilizarse en 1962*, cuando Hu utilizó la teoría de invariantes algebraicos de donde se derivaron sus 7 famosos invariantes a la traslación, rotación y cambio de escala de objetos 2D. *M. K. Hu, "Visual Pattern Recognition by Moment Invariants", IRE Trans. Info. Theory, vol. IT-8, pp.179 187, 1962. 6
MOMENTOS Definición 1. Una función imagen se puede entender como cualquier función real continua f(x,y) de dos variables definida sobre un soporte compacto Ω R R y que posee una integral finita diferente de cero. Definición 2. El momento general Mpq de una imagen f(x,y), donde p,q son enteros no negativos y r = p+q es llamado el orden del momento se define como: M pq = Ω p pq (x, y) f (x, y)dx dy donde la secuencia p00(x,y), p10(x,y),, pkj(x,y) son funciones polinomiales definidas sobre Ω. Dependiendo de la base polinomial utilizada pueden definirse momentos geométricos, momentos complejos y momentos ortogonales. 7
MOMENTOS GEOMÉTRICOS La selección más común es un estándar base de potencias donde pkj (x,y) = x k y k de los cuales se derivan los momentos geométricos: m pq = x p y q f (x, y)dx dy En el caso de una imagen digital los momentos geométricos se definen como: x y m pq = x p y q f (x, y) En el caso de una imagen binaria con valores en {0,1} la ecuación anterior toma la forma: m pq = x y x p y q 8
MOMENTOS GEOMÉTRICOS En la mayoría de las aplicaciones únicamente los momentos hasta de orden 3 son utilizados. Momento de orden cero m00 representa la masa total de la imagen. Para una imagen binaria, m00 coincide con el área geométrica del objeto, es decir, el número de píxeles (x,y) R. Entonces m00 se define como: x y m 00 = f (x, y) Momentos de orden uno m10 y m01 se conocen como momentos estáticos, siendo utilizados para localizar el centro de gravedad o centroide del objeto como: x = m 10 y y = m 01 m 00 m 00 De esta manera, las coordenadas (x, y) señalan el punto donde la masa total del objeto puede ser concentrada sin cambios en los momentos de orden uno a lo largo de los ejes x y y, respectivamente. 9
MOMENTOS GEOMÉTRICOS Momentos de orden dos m20, m02 y m11 se conocen como momentos de inercia y describen la distribución de masa de la imagen con respecto a los ejes coordenados, y se pueden calcular las siguientes características. A partir de los momentos de orden dos se puede calcular el radio de giro de un objeto el cual describe la forma en la cual la masa de un objeto se distribuye alrededor de su eje centroidal y se define como: r x = m 20 m 00 y r y = m 02 m 00 Momentos de orden tres m30 y m03 describen el sesgo proyectivo de un objeto, el cual es una medida estadística del grado de distribución de la desviación de simetría alrededor del eje centroidal: s x = m 30 3 m 20 y s y = m 03 3 m 02 10
MOMENTOS GEOMÉTRICOS Momentos de orden cuatro m40 y m04 describen la curtosis del objeto, el cual es una medida de apuntamiento (i.e., qué tan puntiagudo es): k x = m 40 m y k = m 04 2 y 2 20 m 02 256 px 564 px 450 px 566 px 256 px 564 px 750 px 566 px Forma A Forma B Forma C Forma D Descriptor Forma A Forma B Forma C Forma D m 00 (x, y) 12849 93671 40395 122446 (129,129) (286.3, 286.6) (248.5, 326.5) (271.1, 264.0) (r x,r y ) (132.9,132.9) (302.4, 305.9) (269.1, 377.4) (294.8, 280.1) (S x,s y ) (0.0096, 0.0096) (0.0037, 0.0038) (0.0059, 0.0067) (0.0034, 0.0033) (k x,k y ) (0.9506, 0.9506) (0.1486, 0.1528) (0.3611, 0.4884) (0.1260, 0.1148) 11
MOMENTOS CENTRALES Los momentos geométricos no son invariantes a traslaciones, rotaciones ni cambios de escala. Para darle la propiedad de invariante a traslaciones (sin rotaciones y cambios de escala) se debe desplazar el centroide del objeto al origen del referencial como: x y µ pq = (x x) p (y y) q f (x, y) Los momentos centrales hasta de orden tres pueden computarse como: µ 00 = m 00 µ 10 = µ 01 = 0 µ 20 = m 20 xm 10 µ 02 = m 02 ym 01 µ 11 = m 11 xm 01 = m 11 ym 10 12 µ 21 = m 21 2xm 11 ym 20 + 2m 01 x 2 µ 12 = m 12 2ym 11 xm 02 + 2m 10 y 2 µ 30 = m 30 3xm 20 + 2m 10 x 2 µ 03 = m 03 3ym 02 + 2m 01 y 2
MOMENTOS NORMALIZADOS Los momentos centrales normalizados son invariantes a traslaciones y cambios de escala, lo cual se obtiene al dividir cada momento por un factor de normalización que cancela el efecto de escalamiento. Recordando que los cambios de escala son causado por transformaciones de coordenadas de la forma: x y = α 0 0 α Si f'(x',y') es la imagen f(x,y) después de un escalamiento en cada eje por α, de modo que x'= αx y y'= αy, entonces tenemos que: m pq = ( x ) p ( y ) q f ( x, y ) = α p+q+2 (x) p (y) q f (x, y) x y Por tanto, m'pq = α p+q+2 mpq, y de forma similar µ'pq = α p+q+2 µpq. En particular µ'00 =α 2 µ00. Entonces, los momentos centrales normalizados se definen como: donde γ = p + q +1 para p + q 2 γ η pq = µ pq µ 00 13 2 x y x y
MOMENTOS DE HU A partir de los momentos centrales normalizados, Hu derivó un conjunto de 7 invariantes a rotaciones, traslaciones y cambios de escala, los cuales son: φ 1 = η 20 + η 02 φ 2 = (η 20 η 02 ) 2 2 + 4η 11 φ 3 = (η 30 3η 12 ) 2 + (3η 21 η 03 ) 2 φ 4 = (η 30 + η 12 ) 2 + (η 21 + η 03 ) 2 φ 5 = (η 30 3η 12 )(η 30 + η 12 )[(η 30 + η 12 ) 2 3(η 21 + η 03 ) 2 ] + (3η 21 η 03 )(η 21 + η 03 )[3(η 30 + η 12 ) 2 (η 21 + η 03 ) 2 ] φ 6 = (η 20 η 02 )[(η 30 + η 12 ) 2 (η 21 + η 03 ) 2 ]+ 4η 11 (η 30 + η 12 )(η 21 + η 03 ) φ 7 = (3η 21 η 03 )(η 30 + η 12 )[(η 30 + η 12 ) 2 3(η 21 + η 03 ) 2 ] + (3η 12 η 30 )(η 21 + η 03 )[3(η 30 + η 12 ) 2 (η 21 + η 03 ) 2 ] 14
MOMENTOS DE HU Original Trasladada Escalada 50% Espejo Rotada 45º Rotada 90º Momento Original Trasladada 50% Espejo 45º 90º ϕ1 2.8662 2.8662 2.8664 2.8662 2.8661 2.8662 ϕ2 7.1265 7.1265 7.1257 7.1265 7.1266 7.1265 ϕ3 10.4109 10.4109 10.4047 10.4109 10.4115 10.4109 ϕ4 10.3742 10.3742 10.3719 10.3742 10.3742 10.3742 ϕ5 21.3674 21.3674 21.3924 21.3674 21.3663 21.3674 ϕ6 13.9417 13.9417 13.9383 13.9417 13.9417 13.9417 ϕ7-20.7809-20.7809-20.7724-20.7809-20.7813-20.7809 15
MOMENTOS DE HU Original Trasladada Escalada 50% Espejo Rotada 45º Rotada 90º Momento Original Trasladada 50% Espejo 45º 90º ϕ1 0.1808 0.1808 0.1809 0.1808 0.1808 0.1808 ϕ2 0.0015 0.0015 0.0015 0.0015 0.0015 0.0015 ϕ3 2.03 10 5 2.03 10 5 2.03 10 5 2.03 10 5 2.17 10 5 2.03 10 5 ϕ4 3.04 10 7 3.04 10 7 3.47 10 7 3.04 10 7 3.79 10 7 3.04 10 7 ϕ5 7.14 10 13 7.14 10 13 8.62 10 13 7.14 10 13 1.05 10 12 7.14 10 13 ϕ6-1.08 10 8-1.08 10 8-1.24 10 8-1.08 10 8-1.31 10 8-1.08 10 8 ϕ7 2.50 10 13 2.50 10 13 2.50 10 13 2.50 10 13 2.49 10 13 2.50 10 13 16
MOMENTOS DE INERCIA Los momentos centrales pueden aplicarse para caracterizar medidas geométricas del objeto. El momento de inercia es una característica que permite determinar el ángulo de orientación de un objeto en la imagen. A partir de los momentos centrales µ20, µ02 y µ11, se puede calcular la orientación del eje principal del objeto como: θ = 1 2µ 11 2 tan 1 µ 20 µ 02 Para ajustar el valor del ángulo θ al intervalo [0, π/2] se hacen las siguientes comparaciones: θ = θ si µ 20 > µ 02 y θ > 0 θ si µ 20 > µ 02 y θ < 0 π 2 θ si µ < µ y θ > 0 20 02 π 2 +θ si µ < µ y θ < 0 20 02 y Eje mayor θ = π θ = 62º 2 x θ = 28º 17
MOMENTOS DE INERCIA La excentricidad (o elongación) proporciona la relación entre la anchura y la longitud del objeto, y se calcula como el cociente entre el máximo y mínimo diámetro del objeto. Se calcula a partir de los momentos centrales de segundo orden, µ20, µ02 y µ11, como: ε = 0.95 Diámetro máximo ε = 0.25 Diámetro mínimo ( ) 2 2 + 4µ 11 ( ) 2 ε = µ 20 µ 02 µ 20 µ 02 La excentricidad está en el rango [0,1], donde ε = 0 corresponde con un objeto redondo y tiende a 1 conforme se alarga el objeto. 18 ε = 4.28 10 4