Introducción a la Visión por Computadora

Documentos relacionados
Fundamentos de la Visión Artificial. Prof. Dr. Francisco Gómez Rodríguez Prof. Manuel J. Domínguez Morales 1

Taller de Fotografía Digital Básico

TRANSMISION DIGITAL. PCM, Modulación por Codificación de Pulsos

INTERPOLACIÓN POLINÓMICA Y LA DIVISIÓN DE SECRETOS

ETN 404 Mediciones Eléctricas Docente: Ing. Juan Carlos Avilés Cortez. 2014

Qué es la tecnología digital?

Capítulo 1 CAPÍTULO 1-INTRODUCCIÓN-

[20380] Visió per Computador Prueba 1 (2015) [A] Teoría (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)

Espectro de Vega captado el (de 19h14 a 19h30 TU) con

PROCESAMIENTO DIGITAL DE IMÁGENES MEDIANTE EL USO DE UN FPGA Y LENGUAJE VHDL

Figura 87. Apariencia física de VIFIBIO

5. Despliegue en la PC

Equipos generadores de señal. - Introducción - Generadores de función analógicos - Generadores de función digitales: DDS y AWG

LA CAMARA FOTOGRAFICA DIGITAL (II)

Técnicas de codificación en forma de onda

CCDs DETECTORES TÉCNICAS EXPERIMENTALES EN ASTROFÍSICA. CCD: Introducción. Charged-Coupled Devices (CCD): Historia:

Segmentación de color en imágenes digitales usando Visual C#.Net

Tema 07: Acondicionamiento

Figura 1.12 Señalización analógica y digital de datos analógicos y digitales.

Instituto Tecnológico de Massachussets Departamento de Ingeniería Eléctrica e Informática Circuitos electrónicos Otoño 2000

Ingeniería Superior de Informática

1. Características básicas de emisores y receptores

podemos enfocar al funcionamiento del robot, es decir la parte de electrónica. Para que el

Colección de Tesis Digitales Universidad de las Américas Puebla. Morales Salcedo, Raúl

Sistemas Electrónicos Industriales II EC2112

Unidad Orientativa (Electrónica) Amplificadores Operacionales

5 Ecuaciones lineales y conceptos elementales de funciones

CAPÍTULO 7 2. SUBEXPOSICIÓN, EXPOSICIÓN CORRECTA Y SOBREEXPOSICIÓN

CAPÍTULO 2 PROCESAMIENTO DIGITAL DE IMÁGENES

Conceptos y Terminologías en la Transmisión de Datos. Representaciones de Señales.

Arquitectura de Redes y Comunicaciones

TEMA 5. ELECTRÓNICA DIGITAL

Sistemas de numeración y aritmética binaria

Centro de Capacitación en Informática

1.- INTRODUCCIÓN AL PROCESADO DIGITAL DE IMÁGENES

Digitalización de imágenes con ayuda del histograma

Transformación de binario a decimal. Transformación de decimal a binario. ELECTRÓNICA DIGITAL

Memoria La memoria es la parte del ordenador en la que se guardan o almacenan los programas (las instrucciones y los datos).

Toplogías: Tipo Bus (barra), tipo Star (estrella), tipo Ring (anillo), tipo Starshaped Ring (Anillo estrellado): Forma general.

Introducción general a la compresión de datos multimedia

2. ABRIR UN NUEVO DOCUMENTO DE TRABAJO

Curso de fotografía Técnica fotográfica. Control de la luz Ricardo Sánchez Alférez

Curso de Procesamiento Digital de Imágenes

ELO311 Estructuras de Computadores Digitales. Unidad Aritmética

Última modificación: 1 de agosto de

Componentes del frontal de un receptor GPS

INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA UNIDAD CULHUACÁN INTEGRANTES

Práctica 5: Modulaciones digitales

Circuitos Digitales CON José Manuel Ruiz Gutiérrez

Procesamiento de imágenes en color en Mathematica

IB14 Informática para la construcción. Tema 5. Tratamiento de imágenes digitales

Profundidad tonal. Es el número de grises que tiene una imagen entre la densidad máxima y la densidad mínima.

Encuesta sobre la formación n de recursos humanos en TIC. (caso de México) M

Tema : ELECTRÓNICA DIGITAL

Tecnología para el Agua

José Luis Caballano Alcántara Tutotial Raw Therapee

ÁLGEBRA DE MATRICES. Al consejero A no le gusta ninguno de sus colegas como presidente.

Operaciones morfológicas básicas

OPERADORES LÓGICOS Y DE COMPARACIÓN EN PHP. PRIORIDADES. EJEMPLOS. EJERCICIOS RESUELTOS. (CU00818B)

FORMACIÓN DE EQUIPOS DE E-LEARNING 2.0 MÓDULO DE DISEÑO Y PRODUCCIÓN DE MATERIALES UNIDAD 6 B

BASES FÍSICAS DE LA ULTRASONOGRAFÍA DEL Dr. CABRERO

1. Representación de la información en los sistemas digitales

CAPITULO I INTRODUCCION. Conforme la informática avanza, las imágenes se han convertido en un área muy

Figura 1.4. Elementos que integran a la Tecnología de Información.

Algorítmica y Lenguajes de Programación. Ordenación (i)

Generación de funciones lógicas mediante decodificadores binarios con salidas activas a nivel alto

22.1. t, ms. Y la frecuencia mínima de muestreo será: f smín = 1/T máx = 1/0,1µs = 10MHz.

Computación I Representación Interna Curso 2011

Palabras Clave: Vídeo en FPGA, Procesamiento en Tiempo Real RESUMEN

Una función es una relación entre dos conjuntos de tal manera que para cada elemento del primer conjunto corresponde un solo elemento del segundo

FUNDAMENTOS FÍSICOS DE LA RADIOASTRONOMÍA. CAPÍTULO 1. Propiedades de la radiación electromagnética

Tema 1: Fundamentos de lógica, teoría de conjuntos y estructuras algebraicas: Apéndice

CAPÍTULO 6 SIMULACIONES Y RESULTADOS

EL LOGRO DE SU FORMACIÓN DEPENDE TAMBIÉN DE USTED INSTRUCTOR: ING. JULIO CÉSAR BEDOYA PINO ELECTRÓNICA DIGITAL 2014

Unidad 3 Direccionamiento IP (Subnetting)

UNIDAD I Introducción. M.C. Juan Carlos Olivares Rojas

UNIDAD DE TRABAJO Nº2. INSTALACIONES DE MEGAFONÍA. UNIDAD DE TRABAJO Nº2.1. Descripción de Componentes. Simbología AURICULARES

Instalación eléctrica para un Centro de Procesamiento de Datos

Introducción CAPÍTULO 1

Cambio de la Frecuencia de Muestreo

Objetivos: Al inalizar la unidad, el alumno:

TEMA 9 Cicloconvertidores

Grabación de sonido. Realizado por: Alejandro Martín Daza Manuel Romero Aranda

ARQUITECTURAS ESPECIALES

Conclusiones, aportaciones y sugerencias para futuros trabajos

3.8 Construcción de una ALU básica

Para cada cada valor de la función original lo multiplicas por 3 lo recorres 45 a la derecha y lo subes 5 unidades.

Benemérita Universidad Autónoma de Puebla

CONVERTIDORES DIGITAL ANALÓGICO Y ANALÓGICO - DIGITAL

1.2 Qué es un Sistemas de Información Geográfica?

MATLAB: Introducción al procesamiento de imágenes

Última modificación: 1 de agosto de

CLASIFICACIÓN DE IMÁGENES

TAREA N 3 OPERADORES DE DETECCIÓN DE BORDES

. Cómo es la gráfica de z[n]?

Nuestro objetivo es hacer que la oscuridad sea totalmente visible. Tecnología starlight

Sistemas Conexionistas

Diseño e implementación de Filtros Digitales. Mg. Ing. Luis Romero Dr. Ing. Vicente Mut Dr. Ing. Carlos Soria Año 2011

Matemáticas para la Computación

Atenuación = 10 log 10 db Amplificación = 10 log 10

Transcripción:

Instituto Tecnológico de La Paz Maestría en Sistemas Computacionales Introducción a la Visión por Computadora Dr. Alejandro Israel Barranco Gutiérrez 13 de enero de 2014

Definiciones Computer Vision = Geometry + Measurement + Interpretation (S. Nagabhushana). Ciencia que estudia la interpretación de imágenes mediante computadores digitales. (José Andrés Somolinos Sánchez). Consiste en la adquisición, procesamiento, clasificación y reconocimiento de imágenes digitales. (José Jaime Esquema Elizondo).

Algunas relaciones de la visión por computadora con otras disciplinas

Subcampos de la visión por computadora Adquisición de imágenes Restauración de imágenes Fotogrametría Procesamiento de imágenes Reconocimiento de objetos

Elementos de Percepción visual (Cámaras)

CCD, APS y MEMS Charge-Coupled Device es un circuito integrado que contiene un número determinado de condensadores acoplados. Bajo el control de un circuito interno. Active Pixel Sensor. Sensor que detecta la luz basado en tecnología CMOS y por ello más conocido como Sensor CMOS. Microelectromechanical Systems. Es la tecnología electromecánica, micrométrica y sus productos.

Filtro de Bayer El filtro, máscara o mosaico de Bayer es un tipo de matriz de filtros, rojos verdes y azules, que se sitúa sobre un sensor digital de imagen (CCD o APS) para hacer llegar a cada fotodiodo la información de luminosidad correspondiente a una sección de los distintos colores primarios. Se llama así por su creador, Bryce Bayer, de la empresa Eastman Kodak.

Arquitectura CCD

Comparación APS vs CCD Ventajas APS Consumo eléctrico muy inferior Económico (necesita pocos componentes externos) Lectura simultánea de mayor número de pixeles El conversor digital puede estar integrado en el mismo chip Escaso Blooming ("Smear") o inexistente Mayor flexibilidad en la lectura (Previsualización más rápida, vídeo,...) Los pixeles pueden ser expuestos y leídos simultáneamente Otras topologías posibles (el sensor SuperCCD de Fujifilm emplea una construcción en forma de panel (octogonal) para los píxeles) Distintos tipos de píxeles (según tamaño y sensibilidad) combinables Muy alta frecuencia de imagen en comparación a un CCD del mismo tamaño Desventajas Menor superficie receptora de la luz por píxel Menor uniformidad de los píxeles (mayor ruido de patrón fijo-fpn) Efecto "jelly" o inestabilidad en la imagen con movimientos rapidos o flashes debido (se tuerce el video) al tipo de obturacion giratoria que utiliza.

Cámaras omnidireccionales

Elementos de Percepción visual (Cámaras)

CCD, APS y MEMS Charge-Coupled Device es un circuito integrado que contiene un número determinado de condensadores acoplados. Bajo el control de un circuito interno. Active Pixel Sensor. Sensor que detecta la luz basado en tecnología CMOS y por ello más conocido como Sensor CMOS. Microelectromechanical Systems. Es la tecnología electromecánica, micrométrica y sus productos.

Filtro de Bayer El filtro, máscara o mosaico de Bayer es un tipo de matriz de filtros, rojos verdes y azules, que se sitúa sobre un sensor digital de imagen (CCD o APS) para hacer llegar a cada fotodiodo la información de luminosidad correspondiente a una sección de los distintos colores primarios. Se llama así por su creador, Bryce Bayer, de la empresa Eastman Kodak.

Cámara de color con prisma Con un prisma separa la luz en 3 rayos de colores distintos, requiere alineación precisa.

Arquitectura CCD

Comparación APS vs CCD Ventajas APS Consumo eléctrico muy inferior al CCD Económico (necesita pocos componentes externos) Lectura simultánea de mayor número de pixeles El conversor digital puede estar integrado en el mismo chip Escaso Blooming ("Smear") o inexistente Mayor flexibilidad en la lectura (Previsualización más rápida, vídeo,...) Los pixeles pueden ser expuestos y leídos simultáneamente Otras topologías posibles (el sensor SuperCCD de Fujifilm emplea una construcción en forma de panel (octogonal) para los píxeles) Distintos tipos de píxeles (según tamaño y sensibilidad) combinables Muy alta frecuencia de imagen en comparación a un CCD del mismo tamaño Desventajas Menor superficie receptora de la luz por píxel Menor uniformidad de los píxeles (mayor ruido de patrón fijo-fpn) Efecto "jelly" o inestabilidad en la imagen con movimientos rápidos o flashes debido (se tuerce el video) al tipo de obturación giratoria que utiliza.

Cámaras omnidireccionales

Cámaras Rápidas 969 fps@640x64pixeles

Cámaras con lámpara

Neuroimagen

Cámaras para trabajo en el agua

Cámara Satelital

Microscopio Electrónico

Cámara Telescopio

Cámaras Térmicas

Ultrasonido

Rayos X

Representación de imágenes

Imagen representada en una matriz Las cámaras digitales a color nos entregan 3 matrices La combinación de las tres matrices (RGB) nos da el efecto de una matriz a color

Imagen a color Definimos a una imagen de color en RGB como: I x, y, z 0 Z 255 x 0 x k, y 0 y l, z 0 z 2 Donde: x,y,z son indices en las 3 dimensiones de la imagen y Z es el conjunto de los números enteros.

Imagen en escala de grises A partir de una imagen a color RGB, podemos obtener una versión de la misma en escala de grises: I g (x, y) = (I w x, y, 1 + I w x, y, 2 + I w (x, y, 3)) 3

Manejo de imágenes en MATLAB I=imread('PNPC2012.jpg') subplot(4,1,1) imshow(i) subplot(4,1,2) imshow(i(:,:,1)) subplot(4,1,3) imshow(i(:,:,2)) subplot(4,1,4) imshow(i(:,:,3)) G(:,:)=(I(:,:,1)+I(:,:,2)+I(:,:,3))/3; figure(2) imshow(g) J = rgb2gray(i); figure(3) imshow(j)

Digitalización de señales

Diagrama a bloques básico de la digitalización Muestreo Retención Cuantización Codificación Este esquema recibe como entrada una señal analógica y entrega la versión digitalizada de esa señal de entrada.

Muestreo Muestreo: El muestreo (en inglés, sampling) consiste en tomar muestras periódicas de la amplitud de onda. La velocidad con que se toman esta muestra, es decir, el número de muestras por segundo, es lo que se conoce como frecuencia de muestreo. Variable analógica Variable discreta N y( k) ( t nt ) y( nt ) n 1

Función impulso δ t a = 1 para t = a 0 para t a

Muestreo Se considera un tiempo de muestreo constante por ejemplo de T s segundos entonces la frecuencia de muestreo es: f s = 1 T s (Muestras por segundo) Fs=10; t=0:1/fs:1; x=ones(1,length(t)); stem(t,x) 10 n=0 δ t nt s

Muestreo en el dominio del tiempo y de la frecuencia

Retención Retención: (En ingles, Hold): Las muestras tomadas han de ser retenidas (retención) por un circuito de retención (Hold), el tiempo suficiente para permitir evaluar su nivel (cuantificación). z 0, de orden cero. z 1, de orden uno. z 2, de orden dos.

Ejemplo de un cuantificador de 3 bits

Cuantificación (Cuantización) Cuantificación: En el proceso de cuantificación, a un rango de valores de cada una de las muestras se le asigna un único valor de salida.

Codificación Tensión 3 volts 0111 2.5 volts 0101 2 volts 0100 1.5 volts 0011 1 volt 0010 0.5 volts 0001 0 volts 0000 Código Codificación: La codificación consiste en traducir los valores obtenidos durante la cuantificación a un código; por ejemplo: Binario, HDB3, AMI, entre otros.

Criterio de Nyquist If a function x(t) contains no frequencies higher than B hertz, it is completely determined by giving its ordinates at a series of points spaced 1/(2B) seconds apart. Si una función x(t) no contiene frecuencias mas altas que B, es completamente determinada dando sus ordenadas en series de puntos espaciados por 1/(2B) segundos. En otras palabras: Una señal x(t) de ancho de banda B (en banda base), debe ser muestreada a una frecuencia mínima de 2B para poder ser recuperada. frecuencia de muestreo = fs = 2B

Recuperación de la señal x(t) se puede recuperar totalmente a partir de sus muestras mediante la siguiente función de interpolación: x k = x n f s g k n f s n= Donde: g t = sen(2πbt) 2πBt

En resumen Cuando digitalizamos una señal de ancho de banda B. Podrá ser reconstruida a señal analógica si es muestreada a 2B como mínimo. La alta resolución de los niveles de cuantización reduce el nivel de ruido de esta etapa, aunque aumenta la cantidad de información a almacenar.

Muestreo y reconstrucción % El prorama muestrea una señal senoidal adelantada 90 grados y la % reconstruye frec=2; %Frecuencia de la señal a muestrear fs=4; %Frecuencia de muestreo Ts=1/(fs); %Perido de muestreo t=0:ts:1; %Tiempo discreto seno_s=sin(2*pi*frec*t+(pi/2)); plot(t,seno_s) hold on stem(t,seno_s) % Funcion Sa figure ti=0:ts/30:1 sa=(sin(2*pi*frec*(ti))./(2*pi*frec*(ti))); plot(ti,sa) function g=sa(b,tiempo) if(tiempo==0) g=1; else g=sin(2*pi*b*tiempo)/(2*pi*b*tiempo); end MuestrasR=50 % Cantidad de muestras para recostruir for k=1:muestrasr for n=1:length(t) if(n==1) x(k)=seno_s(n)*sa(frec,((k-1)/muestrasr)-n*ts); else x(k)=x(k)+seno_s(n)*sa(frec,((k-1)/muestrasr)-n*ts); end end end k=0:1/muestrasr:1-(1/muestrasr) figure plot(k,x)

Procesamiento en el dominio espacial

Procesamiento Básico Identidad Inversa (negativo) Umbral Umbral Binario (biumbral) Umbral Binario Invertido (biumbral invertido) Umbral de escala de grises Adición Sustracción Operaciones lógicas Operaciones de vecindad Histograma

Identidad El procesamiento de imágenes generalmente se expresa como una función de transformación T: q x, y = T(p(x, y)) donde: p x, y : pixel de la imagen de entrada q x, y : pixel de la imagen de salida Entonces la transformación identidad crea una imagen idéntica a la imagen de entrada. q = p

Inversa o negativo q = 255 p NEG=255-IR;

Umbralización(Thresholding) b x, y = 0 f(x, y) μ 0 umbralada=im2bw(ir,0.5); imshow(umbralada); 1 f(x, y) > μ 0

Bi-umbral q = 255 p x, y μ 1 or p x, y μ 2 0 μ 1 < p(x, y) < μ 2 [M,N]=size(IR); biumbralada=ones(m,n); for i=1:m for j=1:n if (IR(i,j)<=55 IR(i,j)>=200) biumbralada(i,j)=255; else biumbralada(i,j)=0; end end end

Umbral Binario Invertido q = 0 p x, y μ 1 or p x, y μ 2 255 μ 1 < p(x, y) < μ 2 for i=1:m for j=1:n if (IR(i,j)<=100 IR(i,j)>=200) biumbralada(i,j)=0; else biumbralada(i,j)=255; end end end

Umbral de escala de grises q = 255 p x, y μ 2 p x, y otro caso for i=1:m for j=1:n if (IR(i,j)>=254) umbraladagrises(i,j)=255; else umbraladagrises(i,j)=ir(i,j); end end end

Adición S = p(x, y) + q(x, y) S=IR+IR2;

Sustracción R x, y = p x, y q(x, y)

Operaciones lógicas Para realizar estas operaciones, es necesario contar con imágenes binarias (valores Falso y Verdadero). Las tablas de verdad de las operaciones lógicas son las siguientes: NOT AND OR p1 Ps 0 1 1 0 p1 p2 ps 0 0 0 0 1 0 1 0 0 1 1 1 p1 p2 ps 0 0 0 0 1 1 1 0 1 1 1 1

Operaciones de vecindad 1 2 1 0 0 0 1 2 1 p(x 1, y 1) p(x, y 1) p(x + 1, y 1) p(x 1, y) p(x, y) p(x + 1, y) p(x 1, y + 1) p(x, y + 1) p(x + 1, y + 1) q x, y = 1 p x 1, y 1 + 2 p x, y 1 + 1 p x + 1, y 1 + 0 p x 1, y + 0 p x, y + 0 p x + 1, y + ( 1) p x 1, y + 1 + ( 2) p x, y + 1 + ( 1) p x + 1, y + 1

Histograma figure imhist(ir) El histograma cuenta la cantidad de pixeles en cada nivel de gris de la imagen.