3- Codificación y difusión de información multimedia

Tamaño: px
Comenzar la demostración a partir de la página:

Download "3- Codificación y difusión de información multimedia"

Transcripción

1 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. Bibliografía [FLU95] Understanding networked multimedia [GIB98] Digital Compression for Multimedia [TSU99] Introduction to video coding standards for multimedia communication [JPEGESC] JPEG escalado - Tesis [JPEGAD] JPEG image coding with adaptive quantization [TSU99] Introduction to video coding standards for multimedia communication [H.264] Overview of the H.264 / AVC Video Coding Standard [MPEG4] MPEG-4 Overview [HiJa94] Compressing still and moving images with wavelets TECNOLOGÍAS DE RED AVANZADAS Master IC

2 Introducción a la compresión de datos. Muchas aplicaciones multimedia requieren volúmenes de información importantes: CD-ROM: 648 MB 72 sonido estéreo. 30 de vídeo (estudio TV). Una película de 90 ocuparía 20 GB. Una foto (35 mm) a resolución 2000x2000 ocuparía 0MB. Un canal de HDTV requiere un ancho de banda de 2Gbps. Por esta razón se emplean técnicas de compresión que permitan reducir el volumen de información 2

3 Introducción a la compresión de datos (II). Un sistema de compresión consta de: Codificador y decodificador Codificador y decodificador pueden ser: Asimétricos El codificador suele ser más complejo y lento que el decodificador (Ej.: Vídeo por demanda) Simétricos Coste computacional similar (Ej: Videoconferencia). Con pérdidas (lossy compression) o irreversible Adecuada para medios continuos (audio y vídeo). Mayores tasas de compresión. Sin pérdidas (lossless compression) o reversible: Ficheros de datos, imágenes médicas, etc. 3

4 Factores en el diseño de un codificador. Calidad de la señal - BER (Bit Error Ratio) - SNR (Signal/Noise) - MOS (Mean Opinion Score) Eficiencia - Tasa de compresión Retardo 4 Complejidad - Espacio de memoria - Potencia (mw) - Operaciones/Seg.

5 Entropy encoding Dos clases de técnicas de compresión. Codifica los datos sin necesidad de conocer la naturaleza de estos. De propósito general (todo tipo de datos). Son técnicas de compresión sin pérdidas. Ejemplos: Statistical (Huffman, aritmética,etc.), Run-length. 5 Source encoding Codifica los datos basándose en las características y propiedades de estos. Suelen ser técnicas de compresión con pérdidas. Se obtienen tasas de compresión elevadas. Codificadores/decodificadores de propósito específico. Ejemplos: Differential, transform, vector quantization, etc.

6 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

7 Codificación basada en la entropía. Entropía: Valor medio de información de un conjunto de símbolos procedente de una fuente de información (es imposible de medir en la práctica). H S i p i log 2 p i (p i = probabilidad del símbolo i) Por ejemplo: Sea S = {4,5,6,7,8,9}, en donde la probabilidad de cada símbolo es la misma (/6). H S 6 log Según la teoría de la información (Shannon), esta fuente no puede ser codificada (sin pérdidas) con menos de bits por símbolo.

8 Statistical encoding Trata de identificar los símbolos (patrones de bits) que más se repiten en el conjunto de datos de entrada. Se codifican con pocos bits los símbolos más frecuentes, mientras que los menos frecuentes son codificados con más bits. Ejemplos: Codificación Morse E: y Q: -- - Codificación Huffman. Codificación aritmética. 8

9 Codificación Huffman Representan los símbolos con un número de bits inversamente proporcional a su frecuencia. Algoritmo genérico: Se construye un árbol binario de abajo hacia arriba agrupando los símbolos de menor frecuencia y asignado la suma de las probabilidades de ambos al nodo padre del árbol. Cada símbolo estará representado por una hoja del árbol y su código serán los bits recorridos hasta la raíz del mismo. Ejemplo: 9

10 Codificación Huffman: Ejemplo ABCDE(39) 0 0 BCDE(24) 0 BC(3) DE() 0 Símbolo Código A 0 B 00 C 0 D 0 E A(5) B(7) C(6) D(6) E(5) 0

11 Codificación aritmética Identifica una secuencia de símbolos asignándoles una representación binaria de un intervalo de una longitud inferior a la unidad. Siempre son más eficientes que los códigos Huffman Separa el modelo probabilístico de la asignación de bits pudiendo definir codificadores adaptativos. Es computacionalmente eficiente, aunque está sujeto a patentes. Ejemplo: Supongamos sólo dos símbolos, A y B con una probabilidad de P(A)=/3 y P(B)=2/3.

12 Codificación aritmética: Ejemplo 2/3 A B 8/9 4/9 P(A) = /3 P(B) = 2/3 segmento AA AB BA BB 6/27 8/27 AAA AAB ABA ABB BAA BAB BBA BBB 3/32 5/6 4/6 6/8 0/6 4/8 3/8 /4 código

13 Run-length encoding Se basa en detectar las repeticiones de símbolos (bits, números, etc) en los datos a codificar. Ejemplo: Datos a codificar (42): Datos codificados (2): 35A A827A043 Tasa de compresión: 50% 3 Este patrón es frecuente en multimedia: Audio: Tiras de ceros que representan silencios. Vídeo e imagen: Fondos del mismo color (paredes, cielos, etc.)

14 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

15 Codificación basada en la fuente. Se basan fundamentalmente en las propiedades de la fuente de datos a codificar. Suelen tolerar pérdidas en la codificación (lossy codecs) que perceptualmente pasan inadvertidas para el usuario. Son codificadores de propósito específico. Por término general obtienen mayores prestaciones que los codificadores basados en la entropía. 5

16 Codificación Diferencial Se basa en la codificación de las diferencias entre dos símbolos consecutivos. Ciertos tipos de datos tienen la propiedad de similitud entre símbolos consecutivos: Señal de Audio, vídeo, imágenes, etc. Esto permite codificar con pocos bits las diferencias. Ejemplo: DPCM (Differential Pulse Code Modulation) Codificación con pérdida. 6

17 Transform encoding Se basa en transformar el dominio (Ej.: del temporal al de la frecuencia) de los datos de entrada (Ej.: señal de audio). Ejemplos: Aritmética: Imágen BW 4x4 pixels Restar a todos los pixels el valor del primero Fourier: F(t) C DCT (Discrete Cosine Transformation): t f Muy común en compresión de imágenes estáticas (JPEG). 7 Codificación sin pérdida*.

18 Vector quantization Es directamente aplicable a imágenes y audio. Consiste en lo siguiente (imágenes): La imagen se divide en bloques de tamaño fijo (vectores). Se construye una tabla, code-book, con todos los vectores diferentes encontrados. Se codifica la imagen como una sucesión de índices a la tabla. Tanto el codificador como el decodificador necesitan conocer la tabla (code-book). La tabla puede estar predefinida o ser creada dinámicamente. Si en una imagen predomina un número reducido de vectores, el índice de compresión puede ser importante. 8

19 Vector quantization (II) Ejemplo: Imagen original dividida en vectores de nxn pixels Code-book Si un vector no se encuentra en el code-book: Buscaremos el que más se parezca. Idem + enviar algún dato para aumentar el parecido (valor medio). Idem + enviar lo que sea necesario (vector error) para reconstruir el vector. Codificación con pérdida*.

20 CLUT (Color Look-Up Table) Vector quantization (III) Es utilizado para codificar imágenes RGB, que normalmente no utilizan todos los colores posibles. Se utiliza una tabla (code-book) con los colores usados en la imagen. Cada pixel es representado con el índice de la tabla correspondiente a su color. Ejemplo: Imagen RGB de 24bits de color que solo usa 256. Se construye una tabla de 256 entradas y en cada una de ellas se guarda un color (24 bits). En lugar de usar 24bits/pixel, ahora usaremos 8bits/pixel Tasa de compresión: ~66% Codificación más lenta que decodificación. 2 0

21 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

22 Introducción a la codificación y compresión de audio. Las secuencias de audio forman parte de las aplicaciones multimedia. El estudio de la codificación y compresión se puede enfocar en función de la aplicación: Aplicaciones interactivas (audio-conferencia audio) codecs simétricos. Aplicaciones de difusión y reproducción de medios (TV digital, audio Hi-Fi, DVD, etc.) codecs asimétricos Características de una señal de audio. Distintos tipos de calidad de audio. Técnicas de compresión de audio. 2 2

23 Características del audio 2 3 Una señal de audio no es más que una onda acústica (variaciones de presión del aire) La señal de audio es unidimensional (tiempo) El micrófono transforma las ondas acústicas que lo golpean, en señales eléctricas (niveles de voltaje) El oído es muy sensible a las variaciones de sonido de corta duración (ms) al contrarío que el ojo humano. La relación de dos sonidos A y B se mide en decibelios: db=20 log 0 (A/B). La intensidad de un sonido A se mide en decibelios tomando como referencia el menor sonido audible. 0 db: Menor sonido audible La señal de referencia (B) es una onda senoidal a khz que provoca una presión de dinas/cm 2 A y B son amplitudes (si fueran potencias sería 0 log 0 (A/B)) 50 db: Conversación normal. 20dB: Umbral del dolor.

24 24 Características del audio El rango de frecuencias audibles por los humanos está entre 20Hz y 20KHz. Audible No audible

25 Digitalización y cuantificación. La digitalización de las señales de audio se realizan mediante convertidores A/D. Muestrean la señal analógica de audio a una frecuencia determinada. Según Nyquist: Si la señal de entrada tiene una frecuencia máxima de f, la frecuencia de muestreo tiene que ser de al menos 2f (al muestrear a S f captaremos hasta la frec. S f /2) En el conversor D/A, un filtro paso bajo puede interpolar la parte de señal entre las muestras, para poder reconstruir perfectamente la señal original. 2 5

26 Digitalización y cuantificación. Cuantificación: Las muestras obtenidas se codifican en un número finito de bits Error de cuantificación (quantification noise). Codificación lineal o logarítmica. PCM (Pulse Code Modulation). Usado para la digitalización de señales de audio. Parámetros: S f, bits/muestra, niveles de cuantificación* 2 6

27 Digitalización y cuantificación. Cuantificación PCM lineal Los niveles de cuantificación están espaciados de manera equitativa. Cada bit de resolución añade 6 db de rango dinámico. Con 6 bits por muestra se cubre totalmente el rango dinámico del oído humano. Cuantificaciones no-lineales (logarítmica) Los pasos de cuantificación decrecen logarítmicamente. El oído humano es menos sensible a sonidos fuertes. 2 7

28 Digitalización: Interfaz MIDI MIDI (Musical Instrument Digital Interface). Utilizado para codificar música (instrumentos). Codifica los elementos básicos (notas, silencios, ritmos, etc.) en mensajes MIDI. Cada instrumento tiene su propio código (hasta 27) Un sintetizador interpreta los mensajes MIDI y produce la señal de audio correspondiente. Ventaja: Reduce mucho el ancho de banda necesario (factor de 000!!) Inconvenientes: Necesidad de un sintetizador en ambos extremos (calidad de sonido diferente). Aplicable solo a música. 2 8

29 Calidad de una señal de audio. 2 9 Voz (telefonía) Se define para los servicios de telefonía digital. Estándar G.7 (ITU): Codificación logarítmica. Japón y USA: Transformación µ-law. Resto: Transformación A-law. (+) Parámetros: Señal de audio de 3.5 KHz (BW). S f = 8 KHz 8 bits/muestra. Tasa de bits: 64Kbps (N-ISDN). Otras técnicas de codificación y compresión: DPCM y ADPCM, G.72x, GSM, LPC y CELP, etc.

30 CD-Digital Audio. Calidad de una señal de audio. Calidad de audio superior: Sonido Hi-Fi estereofónico. Utiliza una codificación lineal. Las diferencias de amplitud deben ser respetadas por igual. Parámetros: Señal de audio de 20 KHz (BW). S f = 4. KHz 6 bits/muestra. Soporta estereofonía (dos canales) Tasa de bits:.4 Mbps. Otros estándares utilizan esta calidad de audio: DAT (32.4 y 48 KHz), MPEG (32, 44, y 48 KHz), DVI, etc. 3 0

31 Tasa de bits (throughput): Audio sin comprimir: Calidad telefónica: 64Kbps. Calidad CD:.4 Mbps. Audio comprimido: Parámetros específicos. Calidad telefónica: 32, 6, 4 Kbps (ADPCM, CELP) Calidad CD: 92 Kbps. (MPEG audio) Retardo de tránsito (aplicaciones interactivas) Conversación: Telefonía: < 25 ms (evitar echo). 00 a 500 ms (sensación de tiempo real). 3

32 Varianza del retardo (jitter). Parámetros específicos. Es el parámetro más crítico para los streams de audio. Solución: Técnicas de ecualización del retardo. Se suministra un tiempo adicional antes de comenzar la reproducción, almacenando los paquetes en un buffer de entrada. Consecuencias: Incrementamos el retardo total. Necesitamos recursos de memoria para el buffer de ecualización. Compromiso entre la capacidad de almacenamiento y el máximo jitter tolerable por la aplicación. Tasas de error: Calidad telefónica: < 0-2, Calidad CD: <

33 33 Algoritmos de compresión (Voz) Codificación diferencial: DPCM (Differential Pulse Code Modulation). Explota la redundancia temporal entre las muestras. Se transmite la diferencia entre muestras (bastante menor). Problema: Sobrecarga de gradiente (slope overload) Las diferencias en altas frec.(cercanas a Nyquist) no se pueden representar con el mismo número de bits.

34 Algoritmos de compresión (Voz) Codificación diferencial adaptativa: ADPCM (Adaptive Differential Pulse Code Modulation). Predice la muestra y cuantiza adaptativamente. Predicción: Codifica la diferencia entre la muestra actual y una estimación basada en las últimas n muestras X[n] - D[n] Quantizer (adaptive) C[n] C[n] Dequantizer (adaptive) Dq[n] + Xp[n] Xp[n-] Predictor module Xp[n] + Dq[n] Dequantizer (adaptive) Xp[n-] Predictor module 3 4 Codificador Decodificador

35 Algoritmos de compresión (Voz) Codificación diferencial adaptativa: ADPCM (Adaptive Differential Pulse Code Modulation). Predice la muestra y cuantiza adaptativamente. Cuantización adaptativa: Usa pasos más largos para codificar diferencias entre muestras muy distintas en magnitud (de alta frecuencia) y pasos más pequeños para muestras que son similares (bajas frecuencias). 3 5

36 Una implementación de ADPCM Algoritmo ADPCM (IMA: Interactive Multimedia Association) Algoritmo de dominio público. Calidad de audio e índice de compresión aceptables. Sencillo y capaz de trabajar en tiempo real (software). Indice de compresión: (PCMbits/4) a. X[n] - D[n] Quantizer (adaptive) C[n] C[n] Dequantizer (adaptive) Dq[n] + Xp[n] Xp[n-] Delay Xp[n] + Dq[n] Dequantizer (adaptive) Xp[n-] Delay 3 6 Predictor module Codificador Decodificador

37 Calidad telefónica: Recomendaciones ITU G.70: Digitalización PCM G.7: Codificación logarítmica µ-law y A-law G.72: ADPCM Muestreo a 8 Khz, muestras de 8 bits: 64 Kbps Utiliza diferencias de 4 bits: tasa de bits final 32 Kbps G.722: Sub-Band ADPCM. Muestreo a 6 Khz, muestras de 4 bits: 224 Kbps Codifica señales de audio de hasta 7 KHz (por el muestreo) Descompone la señal en dos bandas de 4 KHz. A cada banda le aplica ADPCM. Tasas de bits finales: 48, 56 y 64 Kbps. G.723, G.726, G.727: Variantes del G.72 (ADPCM). 3 7

38 Calidad telefónica: Vo-coding 3 8 LPC (Linear Predictive Coding) US-FS-05 Define un modelo analítico del aparato fonador Reduce cada segmento de audio a los parámetros del modelo que más se aproximan al original. El decodificador recoge estos parámetros y sintetiza la voz correspondiente. LPC-0E puede bajar hasta 2.4 Kbps. CELP (Code Excited Linear Prediction) US-FS-06. Es una versión mejorada del LPC. Diferencia: Utiliza un code-book con secuencias predefinidas para aplicarlas a cada frame de audio, eligiendo aquella que más se aproxima al original. Además, calcula los errores cometidos. Se envían los parámetros y la versión comprimida de los errores. Tasa de bits de hasta 4.8 Kbps (calidad similar a ADPCM G.72 a 32 Kbps) Variantes CELP: GSM, VSELP, LD-CELP, ITU G.729, QCELP, MELT, etc.

39 Tabla resumen de algunos codecs de audio. Calidad telefónica 3 9 Año Tasa de bits Nombre MOS (Kbps) PCM (PSTN) LPC G.72 ADPCM INMARSAT GSM CELP (US 06) G.728 (LD-CELP) VSELP QCELP G G Half-Rate GSM New LPC 3.3

40 Calidad CD 4 0 Estándares MPEG/audio (Estándar ISO) MPEG (Moving Pictures Expert Group) MPEG/audio ofrece altos índices de compresión, manteniendo la calidad del audio del stream original. Son algoritmos de compresión con pérdidas*. MPEG- /audio Muestreos: 32, 44. y 48 KHz. Soportan uno o dos canales (diferentes modos de operación). Tasas de bits: 32 a 256 Kbps/canal. Indices de compresión: 2.7 a 24. MPEG-2 /audio Compatibilidad hacia atrás con MPEG-. Diseñado para sistemas de sonido multicanal.

41 MPEG- audio. 4 El stream comprimido puede incluir información auxiliar (acceso aleatorio, avance y retroceso rápido, CRC, etc.) Arquitectura de tres niveles MPEG- Nivel I: El más sencillo. Tasa de bits 92 Kbps/canal. Aplicaciones: Philips DCC MPEG- Nivel II: Complejidad media. Tasa de bits 28 Kbps/canal. Aplicaciones: DAB, CD-I, Vídeo CD. MPEG- Nivel III: El más complejo. Ofrece la mejor calidad de audio con tasas de bits sobre 64 Kbps/canal. Está preparado para N-RDSI. Existen codecs hardware de los tres niveles para aplicaciones de tiempo real.

42 MPEG audio: Fundamentos. Se basa en la capacidad de percepción que tiene el oído humano (modelos psico-acústicos) Enmascaramiento de señales débiles (noise masking): 4 2

43 MPEG audio: Fundamentos. Discriminación frecuencial limitada. La agudeza (selectividad) del oído humano en baja frecuencia es muy superior que en altas frecuencias (sub-band coding) 4 3

44 MPEG Audio: Diagrama de bloques Codificador PCM audio Time-Frec Sub-band filtering Asig. Bits. Cuantizador Codificador Formato del stream de bits Stream de bits comprimido Modelo psico-acúst. Datos auxiliares (opcional) Decodificador Stream de bits comprimido Desensamblado Reconst. de bandas Transformación Frec-Time PCM audio 4 4 Datos auxiliares (opcional)

45 MPEG- audio: Niveles. Nivel I: Se divide la señal de audio en 32 bandas de 750 Hz. Tasa de muestreo: 48 Khz. Tamaño de trama: 384 muestras El umbral de enmascaramiento (SMR) se calcula con una FFT de 52 puntos (modelo psico-acústico). Para cada sub-banda se escoge uno de los 5 cuantizadores definidos en función del SMR y la tasa de bits requerida. Nivel II: Utiliza un tamaño de trama de 52 muestras, una FFT de 024 puntos (cálculo del SMR) y una cuantización más fina. 4 5 Nivel III: Incrementa la resolución en frecuencia de las 32 bandas (MDCT), utiliza un modelo psico-acústico más elaborado, y añade una etapa de compresión Huffman.

46 Parámetros de calidad objetivos: MSE (Mean Square Error). MPEG Audio: Calidad de audio Calcula el error cuadrático medio entre la señal original y la reconstruida con el codec. MSE N N i s i s i 2 SNR (Signal-to-Noise Ratio) Relación logarítmica entre dos señales. Se utilizará para comparar la señal original con el error introducido por el codec. Se expresa en decibelios (db). SNR( db) N N i 0log 0 s MSE i 2 PSNR 0log MSE 4 6

47 MPEG Audio: Calidad de audio. Parámetros de calidad subjetivos: MOS (Mean Opinion Score): MPEG define una serie de tests para determinar la calidad de audio generada por cada nivel. Resultados: Fuente: Estéreo, 6bits, 48KHz, 256 Kbps Compresión 6: En condiciones de escucha óptimas, expertos en audición han sido incapaces de distinguir secuencias comprimidas de sus originales. 4 7

48 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

49 Introducción a la codificación de imágenes. Las imágenes que percibimos están compuestas de ondas electromagnéticas (: 250nm - 780nm). A diferentes longitudes de onda, diferentes sensaciones de color. El ojo es más sensible a unos colores que a otros. Dadas tres fuentes de luz de la misma intensidad y distinto color (una roja, otra verde y otra azul), el ojo percibe la verde con el doble de intensidad que la roja, y seis veces más intensa que la azul. Los mecanismos de percepción visual humanos son menos sensibles y estrictos que los auditivos. Ej.: Variaciones de frecuencia, supresión de imágenes, etc. Mezclando 3 colores (RGB) podemos obtener otro. Integra la información que recibe. 4 9

50 50 Captura y digitalización de imagen I Las imágenes digitales están compuestas de píxels (picture element). Una cámara fotográfica digital utiliza un CCD (charge coupled device) para realizar el proceso de adquisición analógica. El CCD tiene una serie de pequeños diodos sensibles a la luz que convierten luz en cargas eléctricas (o sea, fotones en electrones). Cada diodo del CCD captura un píxel de la imagen a adquirir. Para poder situar cada píxel de la imagen (luz entrante) en su diodo correspondiente del CCD se utiliza una lente. Mediante la lente se puede conseguir también realizar zoom óptico (no confundir con zoom digital)

51 5 Captura y digitalización de imagen II Problemática del color: Si el CCD captura la luz directa que recibe de la lente, sólo tenemos la intensidad de luz, pero no su color. Añadimos un filtro (R, G ó B) a cada píxel, de manera que algunos píxels reciben sólo la luz roja, otros la verde y otros la azul. El número de píxels que reciben luz verde es el mismo que la suma de los que reciben luz roja y azul. La información de color que no se ha obtenido en cada píxel se interpola directamente de sus vecinos, usando un DSP.

52 52 Captura y digitalización de imagen III El CCD es un dispositivo analógico. Es necesario un conversor analógico digital (ADC) que obtenga la representación digital de cada píxel a partir de la señal eléctrica generada por cada diodo. Una cámara digital necesita un DSP para gestionar el funcionamiento de la cámara. Realiza el acceso y almacenamiento de fotos en memoria, el proceso de compresión, la interpolación de los colores, gestión de menús, etc. Uno de los más usados, el TMS320DSC24 de Texas Instruments, funciona a 80 Mhz y es utilizado por Kodak en sus productos.

53 Captura y digitalización de imagen IV 5 3 Codificación y recodificación. Cada muestra RGB se codifica con una cantidad de bits por componente de color (p.ej., 8 bits/componente 24 bits/muestra). A veces resulta interesante codificar el nivel de brillo de una muestra (luminancia, o componente Y) y las diferencias de color (crominancias azul, roja y verde, o componentes Cb, Cr, Cg). La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de conversión (aproximada): Y = 0.3R + 0.6G + 0.B (Nivel de brillo o luminancia) U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+28) V = R - Y (Diferencia de color rojo) (equiv. Cr=V/.6+28) Cada uno de los componentes se codifica con 8 bits. Y (8 bits): rango Cb (8 bits) y Cr (8 bits): rango La diferencia de color verde (Cg) es redundante y no se almacena, ya que se puede obtener a partir de la Y, la Cb y la Cr.

54 Captura y digitalización de imagen V Subsampling: El ojo es más sensible a la información de luminancia que de crominancia. Muestra Cr + Muestra Cb Muestra Y o Y CbCr 480 o 576 Y 480 o Cb Cr Formato 4:4:4 Formato 4:2: o 576 Y o 576 Y Formato 4:2:0 240 o 288 Cb Cr Formato 4:: 480 o 576 Cb Cr

55 Tipos de imagen (según su resolución) La resolución de una imagen se mide según el número de píxels por lado (ancho x alto). En cámaras digitales se suele medir en Megapixels (millones de píxels por imagen) ) Common Intermediate Format (CIF) (352x288): Utilizado habitualmente en videoconferencia (junto con Quarter CIF) 2) VGA (640x480): Usado por cámaras de baja calidad. 3) n-megapixels: Ofrecido por cámaras de mayor calidad. A veces, la resolución real de una cámara digital no coincide con la del CCD de esa misma cámara. P.ej, una cámara de 3,3 MP ofrece una resolución de 2048x536. Parte de la circuitería del CCD que transporta los datos al ADC está situada en determinados diodos que no pueden ser usados. 5 5

56 56 Compresión de imagen. Una imagen suele presentar redundancia espacial: Redundancia espacial: Las imágenes tienen información redundante susceptible de ser eliminada o reducida (por ejemplo, el color del cielo en una foto suele ser uniforme y azul :-). El proceso de compresión de imagen consistirá en: ) Eliminar en la medida de lo posible la redundancia espacial utilizando técnicas de source encoding (normalmente mediante transformada matemática). 2) Codificar los datos obtenidos en el paso anterior usando entropy enconding (elimina aun más la redundancia espacial). Para conseguir mayores índices de compresión, este proceso será con pérdidas (cuantización de los datos).

57 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

58 Redundancia espacial: JPEG Es un estándar ISO ( 9) cuyo origen proviene del grupo JPEG (Joint Photographic Expert Group). Codifica imágenes de tono-continuo Dispone de cuatro modos de operación (incluyendo codificación sin perdidas). Se definen una serie de parámetros que permiten codificar las imágenes para obtener una gran variedad de calidades de compresión. Factor de compresión ronda 20:* Es un sistema de codificación simétrico. Forma parte de otros estándares de compresión de secuencias de vídeo (MPEG y H.26*). 5 8

59 Codificación JPEG (pasos) Codificación JPEG en modo secuencial con pérdidas Imagen original (RGB) Prep. de bloques Codificación fuente DCT Cuantiz. Codificación entrópica Run Length Huffman Imagen codificada Tabla Tabla Paso : Preparación de la imagen. No define el formato de imagen original. Podría ser RGB, YUV, YIQ, YCrCb, etc. Convierte la imagen a formato YCbCr utilizando una reducción de color 4:: (sub-sampling) Ej.: RGB 640x480 (VGA): Y (640x480), Cb y Cr (320x240) Se divide la imagen en bloques de 8x8 elementos Ej. anterior: 4800 bloques Y, 200 Cb y 200 Cr. 5 9

60 Codificación JPEG: Transformada DCT Paso 2: Transformada discreta del coseno (DCT). Transforma un dominio de amplitudes al dominio de la frecuencia. Las componentes frecuenciales más altas son susceptibles de ser eliminadas (percepción visual) Se aplica esta transformada a cada bloque de 8x8 obteniendo la matriz de coeficientes DCT asociada Componente (0,0): el nivel de continua DC del bloque (Media) Amplitud x Transformada DCT Coeficiente DCT Fx 6 0 y Fy

61 Codificación JPEG: Transformada DCT(II) DCT-D: (vector 8 elementos) DCT-2D: (matriz 8x8 elementos) ) (2 )cos ( 2 ) ( ) ( x u x x s u C u S ) (2 )cos ( 2 ) ( ) ( u u x u S u C x s 2 ) ( 0, u u C Si ) (, u C Si u N j y N i x y x pixel j C i C N j i DCT N x N y 2 ) (2 cos 2 ) (2 )cos, ( ) ( ) ( 2 ), ( 0 0 N j y N i x j i DCT j C i C N y x pixel N i N j 2 ) (2 cos 2 ) (2 )cos, ( ) ( ) ( 2 ), ( 0 0 Transformada directa Transformada inversa

62 Codificación JPEG: Cuantificación Paso 3: Cuantificación (quantization). Se eliminan los coeficientes menos representativos de la DCT (transformación con pérdidas). Cada coeficiente de la matriz 8x8 es dividido por un valor almacenado en una tabla (quantization table). El estándar sugiere dos tablas una para la componente Y y otra para las componentes Cb y Cr. Estas tablas se pueden escalar con otro parámetro Q que nos permitirá ajustar el índice de compresión requerido Coeficientes DCT Tabla de cuantificación Coeficientes DCT cuantificados

63 Codificación JPEG: Codificación entropía Paso 4: Codificación DPCM de los componentes DC de cada bloque. Bloques sucesivos tienen un valor medio muy similar. Paso 5: Codificación run-length de todos los componente de un bloque. Se hace un barrido zig-zag con el fin de agrupar todos los componentes nulos (39 0 s) A0/3-A/2-A0/5-2-A0/39 6 3

64 Codificación JPEG: Codificación entropía Paso 6: Codificación estadística VLC: Huffman A lo obtenido en el paso anterior se aplica el algoritmo de Huffman para comprimir aún más la información. El resultado de este paso es lo que debemos enviar o almacenar. La decodificación JPEG consiste en realizar el proceso inverso: Inverse Quantization Inverse DCT 6 4 Zig-zag ordering Run-lenght decoder Huffman decoder

65 Codificación JPEG: Ejemplo real (Quant) Bloque de muestras (pixels) DCT Bloque de muestras transformadas Quant IDCT Bloque recuperado de muestras Bloque de muestras cuantizadas

66 Codificación JPEG: Ejemplo real I (RLE+VLC) Codificación RLE+VLC de los coeficientes cuantizados Número de bits Código Bloque de muestras cuantizadas Tabla para la DC 6 6 Paso. Se codifica la DC usando codificación diferencial DPCM Si DC Bloque anterior es 98 codificar Se codifica como: Num. bits necesarios (tabla VLC) + codif + signo DC se codifica como:

67 Codificación JPEG: Ejemplo real II (RLE+VLC) Bloque de muestras cuantizadas Paso 2: Se codifica en zig-zag pares <Run (cuenta de ceros), coeficientes> Run Nivel Código EOB 0 0 s s s s s 0s s s s 2 00 s s Escape Tabla para pares <Run, Niveles> 6 7 Run (Num. De Ceros) Valores Código VLC Parte del bloque codificado con VLC Existe código de escape: RRRR RR NNNN NNNN

68 Codificación JPEG: Ejemplo real III (RLE+VLC) Resultado final de la codificación RLE+VLC Bloque de muestras cuantizadas Tasa de compresión: Run (Num. De Ceros) Valores Código VLC N/A EOB 0 Bloque codificado con VLC Stream final: (85 bits) Bits por píxel: (Núm bits/ Núm píxels) 85/64= 33 bpp Factor de compresión: Tam_comprimida:Tam_original= 85:(8*8*8)= 85:52 :Tam_original/Tam_comprimida= (85/85):(52/85)= :6

69 Codificación JPEG: Ejemplo real IV (Calidad) Bloque de muestras (pixels) Bloque recuperado de muestras Medida objetiva del error: MSE (Mean Square Error) MSE N N i s i s i Medida objetiva de la calidad: PSNR (Peak SNR) PSNR 0log MSE Valores del ejemplo: MSE = PSNR = 3 8 db 2

70 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

71 JPEG escalado Motivación Fundamentos del JPEG escalado Compatibilidad con JPEG estándar Cuantificación variable Resultados

72 Motivación Utilización de tamaño de bloque mayor: NxN. Mayor compactación de energía pero mayor tiempo de cálculo. Descartar coeficientes de alta frecuencia hasta quedarse con sólo una submatriz de 8x8.

73 Fundamentos del JPEG escalado División de la imagen en bloques de NxN puntos conservando sólo los 8x8 primeros coeficientes. Utilización de la DCT recortada de N a 8, modificada. Utilización de nuevas matrices de cuantificación. Elección de N=6.

74 El proceso de codificación/decodificación JPEG escalado Bloques de 6x6 Codificador de JPEG escalado FDCT 6x6 6x6 a 8x8 Cuantificador Codificador de entropía Imagen FDCT 6x6 recortada Imagen comprimida Decodificador de JPEG escalado Bloques de 6x6 Decodifica. de entropía Descuantificador 8x8 a 6x6 IDCT 6x6 Imagen comprimida IDCT 6x6 recortada Imagen

75 Ejemplo de compresión JPEG escalado Original JPEG estándar JPEG escalado Tasa 24-80K Compresión 78: Tasa K

76 Ejemplo de compresión JPEG escalado (continuación) Original JPEG estándar JPEG escalado Tasa 24-80K Compresión 28: Tasa K

77 Compatibilidad con JPEG estándar Aunque el bloque de imagen es de 6x6 el de coeficientes es de 8x8 puntos. Los coeficientes obtenidos se escalan para que estén en el rango de los que se obtienen en una DCT de 8x8. Las funciones básicas son similares. Se incluye información de tamaño real de la imagen, mediante códigos definidos para extensiones.

78 Comparación de la DCT de 8 y 6 puntos Funciones básicas de las DCT de 8 y 6 puntos DCT n=8 DCT n=6

79 Mezcla de formatos Imagen Leída como Se obtiene JPEG escalado JPEG estándar JPEG estándar JPEG escalado

80 Cuantificación variable En el proceso de cuantificación se consigue la compresión a base de anular coeficientes S 0,0 S 0, S 0,7 S,0 S, S,7 S 7,0 S 7, S 7,7 Cuantificación redondeo S vu Q Sq vu vu Sq 0,0 Sq 0, Sq 0,7 Sq,0 Sq, Sq,7 Sq 7,0 Sq 7, Sq 7,7 Para conseguir más ceros hay que incrementar los valores Qvu, lo que afecta a todos los bloques

81 Cuantificación variable: propuesta Utilización de una función de cuantificación con umbral. Sq vu redondeo S vu, si S vu Q vu Q > umbral vu 0, en otro caso Clasificación de los bloques en categorías. Utilización de un umbral distinto para cada categoría.

82 Ejemplo de clasificación de bloques y asignación de umbrales Zona : Hasta 47 ceros Umbral,0 Zona 2: de 48 a 55 ceros Umbral,5 Zona 3: de 56 a 59 ceros Umbral 2,5 Zona 4: de 60 a 63 ceros Umbral,0

83 Ejemplo de cuantificación adaptativa: detalle de la cara de Lena Sin cuantificación adaptativa Con cuantificación adaptativa

84 Ejemplo de cuantificación adaptativa: detalle del sombrero de Lena Sin cuantificación adaptativa Con cuantificación adaptativa

85 Resultados Detalle de la cara de Lena a 0.25 bpp JPEG estándar JPEG escalado JPEG escalado con cuantificación adaptativa

86 Detalle de la cara de Lena a 0.5 bpp JPEG estándar JPEG escalado JPEG escalado con cuantificación adaptativa

87 SNR' Relación Señal-Ruido para distintas tasas de bits de la imagen Lena estándar escalado adaptativo Lena 52x , 0,5 0,2 0,25 0,3 0,35 0,4 0,45 0,5 Tasa de bits

88 SNR' Relación Señal-Ruido para distintas tasas de bits de la imagen Catedral 26 estándar escalado adaptativo estándar (:2) escalado (:2) adaptativo (:2) Catedral 899x07 y 450x554(:2) 0, 0,5 0,2 0,25 0,3 0,35 0,4 0,45 0,5 Tasa de bits

89 SNR' Escalado y Adaptativo / Estándar Relación del SNR de las imágenes con JPEG escalado y adaptativo frente al estándar,,08 Escalado Adaptativo,06,04,02 0,98 0, 0,5 0,2 0,25 0,3 0,35 0,4 0,45 0,5 Tasa de bits

90 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

91 Introducción Una secuencia de vídeo es una sucesión de imágenes que producen sensación de movimiento. El proceso completo de transmisión de vídeo con compresión consiste en: Adquisición del vídeo a transmitir. Captura analógica de la secuencia de imágenes. Digitalización del vídeo. (Re)codificación y subsampling de las muestras. Típicamente se pasa de RGB a YCbCr Subsampling de la crominancia (de 4:4:4 a 4:2:0 ó 4:2:2) Compresión del vídeo. Transmisión progresiva del vídeo comprimido (a ser posible usando protocolos con soporte multimedia) 9

92 Captura de vídeo analógico Las imágenes (dos dimensiones) son convertidas en una señal analógica. Se capturan las imágenes a intervalos regulares. Cada imagen (cuadro o frame) es barrida calculando la intensidad de cada punto (B&W). Para reproducir la imagen se realiza el proceso inverso. Placa de barrido a Líneas de barrido Líneas de barrido mostradas Lentes t

93 Captura de vídeo analógico II La captura (y reproducción) de imágenes en color es muy similar a la de blanco y negro. En este caso se utilizan tres haces de barrido (RGB). Conversión RGB a YUV (compatibilidad con señales B&W). Lentes Filtros R G B Placa de barrido a a a t t Y: Luminancia (intensidad). U y V: Diferencias de color. El ojo humano es más sensible a la intensidad (brillo) que a la información de color (subsampling). Divisor Cámara R G B Y U V t C Y+C TV Color Demod. Conv. R G B TV B&W CRT 9 3 Codificador Modulador Y+C Filtro Y CRT

94 Captura de vídeo analógico III Parámetros de barrido: Relación de aspecto (ancho:alto): 4:3 Existen distintos estándares: NTSC (Usa y Japón): 525 líneas, 30 frames/s PAL/SECAM (Resto): 625 líneas, 25 frames/s. Algunas líneas (superiores e inferiores) no son visibles. Durante el retorno vertical, se puede insertar información adicional (teletexto). Barrido entrelazado y progresivo. Entrelazado. Cada cuadro se representa con dos campos sucesivos (uno con las líneas impares y otro con las pares) (60 c/s ó 50 c/s). 9 4

95 Captura de vídeo analógico IV Parpadeo de imagen (flicker) Efecto que aparece cuando la imagen no es refrescada con suficiente rapidez. La retina mantiene una imagen durante un tiempo antes de que desaparezca. Valor mínimo: 50 imágenes/segundo Continuidad de movimiento. Viene determinada por el número de cuadros diferentes por segundo. No se recomienda utilizar menos de 25 cuadros/s. Ancho de banda de una señal de vídeo analógico: 6 MHz. 9 5

96 Digitalización ITU-R (CCIR-60): Estándar para la digitalización de señales de TV. Define los parámetros de muestreo, cuantificación, barrido y resolución de imagen que se deben tomar para digitalizar una señal de TV analógica. Parámetros de barrido: Dos formatos (NTSC y PAL/SECAM) 525 líneas y 858 muestras/línea - 30 frames/seg. 625 líneas y 864 muestras/línea - 25 frames/seg. Las muestras corresponden a la luminancia (Y): Intensidad de luz de cada pixel (cantidad de blanco). Las diferencias de color Cr (U) y Cb (V) se muestrean a la mitad (429/línea, 432/línea): Sub-sampling 4:2:2. 9 6

97 Digitalización II Cada línea tiene una zona visible (línea activa). Este estándar define una línea activa de 720 pixels. Se define un número de líneas visibles por cuadro: 480 (NTSC), 576 (PAL/SECAM). Barrido entrelazado: Un cuadro (frame) está formado por dos campos: El primero con las líneas impares y el segundo con las pares. Línea completa Tiempo Línea activa 720 muestreos Frecuencia de muestreo única. 525x858x30* = 625x864x25 = 3,5 MHz. 9 7

98 Digitalización III Codificación y recodificación. Cada muestra RGB se codifica con 24 bits/color. La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de conversión (aproximada): Y = 0.3R + 0.6G + 0.B U = B - Y (Diferencia de color azul) (equiv. Cb=U/2+28) V = R - Y (Diferencia de color rojo) (equiv. Cr=V/.6+28) Cada uno de los componentes se codifica con 8 bits. Y (8 bits): rango Cb (8 bits) y Cr (8 bits): rango o 576 R G B 480 o 480 o Cb Y Cr 9 8 Subsampling 4:2:2

99 Codificación: RGB 9 9

100 Codificación: YCbCr 0 0

101 Codificación: Y Subsampling (I) 0

102 Codificación: Y Subsampling x2 (II) 0 2

103 Codificación: Y Subsampling x4 (III) 0 3

104 Codificación: Y Subsampling x8 (IV) 0 4

105 Codificación: CbCr Subsampling (V) 0 5

106 Codificación: CbCr Subsampling x2 (VI) 0 6

107 Codificación: CbCr Subsampling x4 (VII) 0 7

108 Codificación: CbCr Subsampling x8 (VIII) 0 8

109 Tipos de vídeo (según su calidad) La percepción de calidad de una señal de vídeo se basa en tres parámetros: La resolución de las imágenes. La frecuencia de reproducción (cuadros/s.). El tipo de barrido (progresivo o entrelazado) Televisión de alta definición (HDTV). Existen diferentes variantes acerca HDTV. 920x080/60, 920x080/30-24, 280x720/30-24 Relación de aspecto 6:9 Vídeo digital profesional (studio-quality). Estándar ITU-R (CCIR-60) de vídeo digital. 0 9

110 Tipos de vídeo (según su calidad) Vídeo de difusión (TV broadcast). Difusión de señales de televisión analógicas. Estándares NTSC y PAL/SECAM. Reproductor de Vídeo (VCR-quality). Grabación de vídeo analógico (en VHS) Menor resolución de imagen (la mitad de PAL/SECAM). Videoconferencia (Low-speed). Tasas de bits pequeñas (alrededor de 28 Kbps) Resolución de imagen 4 veces inferior al vídeo digital. ITU-TS H.26: Common Intermediate Format (CIF) 352x288 La secuencia de cuadros/s se reduce entre 5 y 0. 0

111 Parámetros específicos de red I Lo que debe suministrar una red para el envío en tiempo real de una secuencia de vídeo. Tasa de bits. Calidad Estándar Sin comprimir Mbps Comprimido Mbps HDTV 920x080/60 Sin comprimir 2000 Comprimido MPEG-2 25 a 34 ITU-R digital TV Sin comprimir ITU-R Comprimido MPEG-2 3 a 6 TV broadcast MPEG-2 2 a 4 VCR MPEG-,2 Videoconferencia H.26 0.

112 Parámetros específicos de red II Retardo y varianza del retardo. Normalmente se envían una secuencia de vídeo sincronizada con el audio correspondiente. La sincronización es muy importante y necesaria desde HDTV hasta VCR. En Videoconferencia no es tan importante ya que la imagen no es continua (pocos cuadros/s). En estos casos, los requerimientos para estos parámetros los impone el audio (más sensible). Valores indicativos para la varianza del retardo: HDTV: 50 ms. Vídeo difusión: 00 ms. Videconferencia: 400 ms. 2

113 Parámetros específicos de red III Tasa de error. El vídeo comprimido es más sensible a los errores. La degradación de la calidad de vídeo percibida depende: BER de la red Del tipo de error (simple, ráfaga, bloque, etc.) Donde se produce ese error. El índice de compresión de vídeo. Mecanismos de recuperación ante errores: Técnicas de protección de la señal. FEC (Forward Correction Codes). Marcas de resincronización. Reversible VLC. Técnicas de paquetización. Ocultación de errores (error concealment) Cuando se pierden bloques o llegan demasiado tarde. Técnicas de extrapolación e interpolación de cuadros. 3

114 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

115 Redundancia temporal Se basa en la similitud de cuadros sucesivos en una secuencia de vídeo. Ej.: Secuencias de plano estático. Se utilizan técnicas de codificación diferencial o transformada 3D Sólo se codificarán las diferencias entre cuadros sucesivos (DPCM). La reconstrucción de un cuadro puede estar basado en otro(s) anterior(es). Un algoritmo típico de eliminación de redundancia temporal (motion compensation) es el que emplea MPEG. 5

116 Redundancia temporal (MPEG-) Cuadros de referencia y cuadros auto-contenidos Si F lo usamos para construir F2, se dice que F es un cuadro de referencia (reference frame). Si un cuadro no se construye a partir de ningún otro, se dice que es auto-contenido (intracoded frame) Normalmente estos sirven de referencia para otros. Macrobloques (macroblocks) 6x6 pixels (6 bloques de 8x8: 4Y,U y V). F F2 F3 6

117 Redundancia temporal (MPEG-) Vectores de movimiento (motion vector) Identifican el desplazamiento de un determinado macrobloque en el cuadro actual respecto a la posición que tenía en el cuadro de referencia. Los vectores de movimiento se aplican cuando se identifica un macrobloque existente en el cuadro de referencia (matching blocks) Cuadro de referencia Vector de movimiento Δx = -20, Δy = 0 Macrobloques idénticos 7 F F2

118 Redundancia temporal (MPEG-) Búsqueda de macrobloques. Se buscan los macrobloques del cuadro a codificar en el cuadro de referencia. Si se encuentra el mismo macrobloque, sólo se codifica el vector de movimiento correspondiente. Si no se encuentra exactamente el mismo se elige el más parecido (macrobloque INTER). Se codifica el vector de movimiento. Se calcula el macrobloque error (las diferencias) aplicándole codificación estilo JPEG (DCT, quant, RLE+VLC en zigzag). Si no se encuentra ningún bloque similar (mb. INTRA) Se codifica dicho macrobloque con codificación estilo JPEG. 8

119 Tipos de cuadros Redundancia temporal (MPEG-) I (Intracoded frames): Cuadro codificado usando JPEG (autocontenido). P (Predictive frames): Cuadro basado en las diferencias respecto a un cuadro de referencia anterior (tipo I). B (Bidirectional frames): Cuadros basados en la interpolación de un cuadro anterior y otro posterior en la secuencia (tipo I o P). Cuadro de tipo I autocontenido Cuadro de tipo B basado en F y F3 Cuadro de tipo P basado en F 9 F F2 F3 Macrobloque encontrado!! Macrobloque encontrado!!

120 Redundancia temporal (MPEG-) Secuencias de cuadros (Group Of Pictures) Los cuadros de tipo I son los menos comprimidos, a continuación los de tipo P y por último los que más compresión obtiene son los de tipo B. Secuencias típicas: IBBBPBBBI IBBPBBPBBI (PAL) IBBPBBPBBPBBI (NTSC) I B B P B B P B B I 2 0

121 Redundancia temporal (MPEG-) La importancia de los cuadros de tipo I. En un sistema de vídeo es habitual el usar los controles de avance, retroceso, pausa, etc. Si queremos detener la secuencia de vídeo, necesitamos encontrar el último cuadro I para reconstruir el cuadro donde se ha detenido la imagen. Sirven como puntos de sincronización. Se estima que deben aparecer al menos un cuadro I cada ms. Si se está difundiendo una secuencia de vídeo comprimida (TV broadcast, videoconferencia, etc) Permite engancharse rápidamente y recuperarse ante la recepción de algún cuadro dañado. 2

122 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU TECNOLOGÍAS DE RED AVANZADAS Master IC

123 Estimación de movimiento: Algoritmos La parte más costosa de la estimación de movimiento corresponde a los algoritmos de búsqueda de macrobloques en el cuadro(s) de referencia. Provoca codificación asimétrica Los algoritmos más conocidos son los siguientes: Búsqueda completa (Full-Search). TTS (Three-Step Search) Búsqueda logarítmica. Búsqueda en cruz (Cross-Search) OTS (One-at-a-Time Search) Vecinos más próximos (Nearest Neighbours Search) Búsqueda jerárquica. 2 3

124 Estimación de movimiento. Se define una función de coste que calcula el error entre dos macrobloques, por ejemplo, SAE (Sum of Absolute Errors)* : SAE N i, j Ci, j Ri, j i0 M j0 (i,j) está definido dentro del área de búsqueda (NxM) determina las dimensiones del macrobloque. C(i,j) y R(i,j) definen los pixels del macrobloque actual y referencia respectivamente. Las coordenadas (i,j) que menor SAE exhiban determinarán el vector de movimiento del macrobloque actual. 2 4 (*) Más conocido como SAD (Sum of Absolute Differences)

125 Algoritmos: Full Search. Examina todos los puntos del área de búsqueda (+/- p) Complejidad computacional por macrobloque: Número total de posiciones: (2p + ) 2 Cada posición (i,j), MxN pixels. Cada pixel requiere: resta, suma y valor absoluto. Complejidad (secuencia IxJ F fps) Ejemplo: 2 MB 2 p MN O 3 O IJF FS OMB MN Broadcast TV (I=720, J=480, F=30, N=M=6) Coste de este algoritmo: GOPS (p=5) ó 6.99 GOPS (p=7) 2 5

126 Algoritmos: Three-Step Search. (-7,-7) (0,-7) (7,-7) MV: (7,-3) 2 6 (-7,7) (0,7) (7,7) Coste: 2 Examina log p puntos.02 GOPS (p=5) ó 770 MOPS (p=7) Busca en la posición (0,0) 2. S=2 N- (step size) 3. Busca 8 posiciones a +/-S píxeles alrededor de (0,0) 4. De las nueva posiciones elige aquella con el SAD menor. 5. S=S/2 y el nuevo origen de búsqueda el punto obtenido en Repetir pasos 3-5 hasta que S=.

127 Algoritmos: Búsqueda logarítmica. (-7,-7) (0,-7) (7,-7) MV: (5,-3) (-7,7) (0,7) (7,7) Coste: Examina 20 puntos 66 MOPS (p=7 y N=2).. Busca en la posición (0,0) y establece S=N (step size) 2. Selecciona 4 posiciones a S píxeles del origen en los ejes X e Y. 3. Calcula la posición que ofrece el menor SAD, fijándola como el nuevo origen de la búsqueda 4. Si esta posición es la central de las 5 seleccionadas S=S/2 5. Si S= ir al paso 6, sino ir al paso Selecciona el origen actual y las 8 posiciones de alrededor, y calcula aquella que minimiza el SAD

128 Algoritmos: Búsqueda en cruz (Cross Search) 2 8 (-7,-7) (0,-7) (7,-7) (-7,7) (0,7) (7,7) Coste: Examina 523 MOPS (p=7). log p puntos MV: (-3,-5). Establece el origen en la posición (0,0). S=2 N- (step size) 2. Selecciona 4 posiciones a +/-S píxeles del origen formando una cruz (X) y el propio origen. 3. Calcula la posición que ofrece el menor SAE, fijándola como el nuevo origen de la búsqueda 4. Si (S>) entonces S=S/2 y va al punto 2. Sino ir al punto Si la mejor posición está en el punto superior izquierda o inferior derecha de la X, evaluar 4 puntos más en forma de X a una distancia de +/- pixel. Sino hacer lo mismo pero con los 4 puntos distribuidos en +.

129 Algoritmos: OTS (One-at-a-Time Search) (-7,-7) (0,-7) (7,-7) MV: (-4,-3) (-7,7) (0,7) (7,7) Coste: 3 2 Examina 2 puntos 369 MOP.. Establece el origen en (0,0). 2. Selecciona el origen y las dos posiciones vecinas en el eje X 3. Calcula la posición que menor SAD exhiba. Si es el origen ir al paso Establece el nuevo origen en la posición que ha ofrecido el menor SAD. Ir al paso Repetir los pasos 2 al 4 seleccionando las posiciones en el sentido vertical (eje Y). Puede dar lugar a mínimos locales!

130 Algoritmos: Vecino más próximo. (-7,-7) (0,-7) (7,-7) MV: (-3,-4) (-7,7) (0,7) (7,7) Coste: Examina 2 puntos 369 MOP Calcula el SAD del (0,0). 2. Establece el origen de búsqueda a la posición del vector supuesto (predicted vector) 3. Selecciona 4 posiciones alrededor del origen en forma de Si el origen de búsqueda (o la posición 0,0 en la primera iteración) ofrece el menor SAD entonces fin de búsqueda. Sino establece el nuevo origen de búsqueda en la posición que menor SAD ha ofrecido. Propuesto para H.263 y MPEG-4.

131 Estimación de movimiento: Otras consideraciones. Estimación de movimiento con fracciones de pixel Se basa en realizar la estimación de movimiento con mayor precisión, ya que a veces el movimiento real no se ajusta a desplazamientos de píxel enteros. Half-Pixel motion estimation Se obtiene un imagen de mayor resolución interpolando un punto de la imagen entre cada dos píxeles. A b A b A c d c A b A b A A b A b A d c d c d c c Se incrementan notablemente las prestaciones del algoritmo de estimación de movimiento a expensas de un mayor coste computacional. H.263 utiliza está técnica, incluso se propone utilizar ¼ y /8 de píxel para el estándar H A: Píxeles reales (Enteros) b,c,d: Píxeles interpolados. Las flechas indican la dirección de interpolación.

132 Estimación de movimiento: Mejoras propuestas. Vectores de movimiento fuera del cuadro de referencia. Para estimar correctamente el movimiento que se produce en los bordes del cuadro. Tamaño de bloque variable. Para realizar estimación de movimiento más precisa. Se utiliza en H.263 (Anexo F) y H.264. Tamaños: 6x6;8x8;4x4;8x6;6x8... OBMC (Overlapped Block Motion Compensation) Objetivo: Suavizar los efectos de blocking que aparecen en los bordes de los macrobloques. Incremento significativo del coste computacional. H.263 recomiendo utilizar filtros de salida (deblocking filters) que realizan esta operación a un coste computacional muy inferior. Modelos de estimación más complejos: Region-based, Picture Warping, Mesh-based, Object-based

133 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

134 Estándar MPEG. Conjunto de estándares ISO para la grabación y transmisión digital de audio y vídeo. En su evolución se han desarrollado varias versiones del estándar MPEG: MPEG- (ISO 72) ( 9): CD-ROM vídeo (,5 Mbps). MPEG-2 (ISO 388) ( 93): TV Broadcast (4-6 Mbps). HDTV (25-34 Mbps). MPEG-4 (ISO 4496) ( 99): Originalmente: Videoconferencia (4,8 a 64 Kbps). Enfoque universal de tratamiento de elementos multimedia. MPEG-7 (00-?): Descripción de contenido multimedia (videodatabases) MPEG-2 (0-?): Uso transparente de contenido multimedia entre redes y usuarios heterogéneos. 3 4

135 Relación entre los estándares MPEG. 3 5

136 MPEG- MPEG- (ISO 72) ( 9) MPEG-Vídeo (IS 72-2) MPEG-Audio (IS 72-3) MPEG-System (IS 72-): Multiplexado y sincronización. MPEG-Conformance Testing (IS 72-4) Patrones de prueba, medida de calidad, etc MPEG-Software Coding (IS 72-5) Directrices para la codificación de los algoritmos. Propósito de MPEG- Almacenamiento en CD-ROM de audio (calidad CD) y vídeo (calidad VCR) sincronizado (,5 Mbps). 3 6

137 MPEG- Características de MPEG-: Resolución de imagen: 352x(288 ó 240) (PAL/NTSC). Reducción de color (sub-sampling): 4:2:0. Barrido progresivo (no entrelazado). Tasa de cuadros: 25/30 (PAL/NTSC). Incluye cuadros de tipo D (DC-coded): Operaciones de avance rápido (Fast Forward). Codificador/decodificador asimétrico. Tasa de compresión: 27:. Audio encoder Los codificadores de audio y vídeo trabajan por separado. Reloj System Mux. Salida MPEG- 3 7 Utilizan un reloj común para establecer el tiempo de cada una de sus capturas (system). Vídeo encoder

138 Conjunto de estándares ISO 388 ( 93). Propósito: MPEG-2 Mejorar la calidad de imagen respecto al anterior sin incrementar excesivamente la tasa de bits requerida Calidad de vídeo profesional (studio-quality) y HDTV Aplicación: Difusión de señales de TV, HDTV, VOD La codificación/decodificación es muy similar a la de MPEG- salvo algunas diferencias: No se incluyen cuadros de tipo D. Permite bloques de 6x8 para vídeo entrelazado. Otras mejoras (permite DC de hasta 0 bits, cuantización no lineal, nuevas tablas VLC, escalabilidad SNR y multiresolución) 3 8

139 MPEG-2 Características de MPEG-2. Soporta barrido entrelazado y progresivo. Puede trabajar con distintas resoluciones (nivel): CIF: 352x288/240 (VCR quality) (Compatibilidad MPEG-) Principal: 720x576/480 (studio-quality) High-440: 440x52 (HDTV) High: 920x080 (HDTV) Define varios perfiles de implementación Detalles de los algoritmos de compresión y parámetros de imagen, barrido, etc. El multiplexado y sincronización es más general y flexible que MPEG- Se pueden multiplexar/sincronizar varias fuentes de audio, vídeo y datos (ej.: subtítulos en varios idiomas). 3 9

140 Propósito: Diseño de aplicaciones multimedia interactivas distribuidas. MPEG-4 Aplicación: Televisión digital Compatibilidad con MPEG-2 (backware compatibility) Aplicaciones multimedia interactivas El usuario puede interaccionar con los objetos multimedia de la sesión. Distribución de información multimedia (tipo WWW) A través de una red, se permitirá el acceso y distribución a información multimedia, facilitando su diseño y presentación. 4 0

141 Características: Accesibilidad de la información de manera universal y robusta. Alta interactividad con la información multimedia. Definición de escenarios virtuales compuestos por objetos independientes (AVOs). El usuario puede modificar/configurar el escenario actual. Codificación conjunta de datos sintéticos y reales. Codificación eficiente de la información. Mejoras en la compresión y multiplexación de la información. Codificación de objetos con forma irregular. MPEG-4 4

142 MPEG-4 4 2

143 3.3 Estándar H.26. Pertenece al conjunto de estándares H.320 del ITU dedicados a videoconferencia sobre RDSI. H.320: Definición de la familia de estándares H.22: Multiplexado, sincronización sobre uno o varios canales RDSI y empaquetamiento (framming). H.242/H.230: Establecimiento y control de sesión. H.224/H.28: Control remoto de cámaras. H.233 y H.234: Cifrado y autenticación de los datos. T.20: Soporte para aplicaciones (transferencia de imágenes, anotaciones compartidas, etc.) G.7, G.72x...: Algoritmos de compresión de audio H.26: Compresión de vídeo (conocido como px64). 4 3

144 Estándar H.26. Características de H.26: Formato de imagen: YCbCr CIF: 352x288 (opcional) QCIF: 76x44 (obligatorio) Reducción de color: 4:2:0 Tasa de cuadros/seg: como máximo 30 max. Mecanismo de compresión similar a MPEG-: Para la redundancia temporal se emplean mecanismos similares a MPEG, basados en macrobloques (6x6). H.26 define el concepto de GOB (Group Of Blocks) GOB = 3x macrobloques (QCIF: 3 GOBs) 4 4

145 Sólo se definen dos tipos de cuadros: I y P. No existen secuencias predefinidas de cuadros. Decisión de codificación I o P para cada cuadro. Estimación de movimiento (motion estimation): Se realiza a nivel de macrobloque Estándar H.26. Búsqueda restringida en un área de +-5 pixels, usando sólo la información de luminancia (Y). Resultado de la búsqueda: Macrobloque del cuadro de anterior que más se parece al actual Cálculo de las diferencias (macrobloque error). Si superan un cierto umbral se codifican (DCT), si no se elimina el macrobloque error, utilizando sólo el vector de movimiento. Cuantificación lineal (menos costosa). Se siguen utilizando run-length y Huffman (VLC). 4 5

146 Estándar H.26. Esquema del formato H.26 PSC TR PType GOB GOB2... GOBm GOB Start Grp# Quant MB... MBn Addr Type Quant Vector CBP b0 b... b5 DC Run, Valor... Run, Valor EOB 4 6

147 Otros estándares H.26x. H.263: Mejora, amplía y sustituye el H.26 De propósito general (no sólo para videoconf.) Incluye compensación de movimiento de medio-píxel Soporta cinco resoluciones (SQCIF, QCIF, CIF, 4CIF y 6CIF) Permite estimación de movimiento bidireccional y sin restricción en el tamaño de la ventana de búsqueda H.263+: Añade nuevas características a H.263 Escalabilidad SNR, espacial y temporal Predicción de los valores de los coeficientes de la DCT H.264: Mejora la eficiencia en codificación DCT con enteros y tam. bloque 4x4, compensación de movimiento con bloques de tamaño variable, etc. 4 7

148 Otros estándares H.26x. Comparación subjetiva MPEG-4 - H

149 Conclusiones 4 9 Las imágenes son captadas por cámaras de vídeo que proporcionan una señal analógica RGB. La digitalización está basada en el estándar ITU-R En función de la calidad de vídeo deseada, existen diversos formatos de imagen, barrido, etc. Se definen distintos parámetros de red de importancia para el transporte de vídeo Algoritmos de compresión de vídeo Fundamentos: Redundancia temporal Algoritmos de estimación de movimiento: Alto coste computacional. Estándares de compresión: Familia MPEG: -2-4 Diseñados para procesar vídeo digital de calidad (Sector consumo). Familia ITU: H Diseñados para comunicaciones audiovisuales en distintos tipos de redes (RDSI, IP, telefonía, etc.)

150 3- Codificación y difusión de información multimedia Factores de diseño de un codec Codificación basada en la entropía Ejemplos: Huffman, Aritmética, etc. Codificación basada en la fuente. Ejemplos: Diferencial, Transformada, etc. Codificación y compresión de audio Compresión de imagen. Redundancia espacial. Estándar JPEG JPEG Escalado Compresión de vídeo. Digitalización y Codificación de vídeo. Tipos de vídeo. Redundancia temporal. Estimación de movimiento: algoritmos. Estándares: MPEG e ITU Difusión de vídeo. TECNOLOGÍAS DE RED AVANZADAS Master IC

151 Introducción. 5 Desde el punto de vista de la red: Un stream de vídeo ha de ser paquetizado para su transporte. La pérdida de paquetes implica una degradación de la calidad de vídeo que observa el destinatario. Es por ello que resulte de interés el estudio de técnicas que protejan el vídeo en su viaje al destino y que los errores detectados puedan ser ocultados al usuario final Video resilience. Desde el punto de vista del transporte de vídeo en sistemas y redes heterogéneos: Interoperabilidad de distintos codecs con bitstreams incompatibles en la red heterogeneous transcoding. Posibilidad de cambiar los parámetros de codificación (i.e. bitrate) de un mismo codec homogeneous transcoding. Desde el punto de vista de la aplicación: Las redes (i.e. Internet) tienen un comportamiento muy variable e impredecible en relación al ancho de banda disponible. Por ello, con el fin de optimizar el uso de recursos disponibles en la red y maximizar la calidad de vídeo entregada al destinatario, se requieren mecanismos de control de flujo extremo-a-extremo.

152 Control de flujo. Las técnicas de control de flujo deberán regular el bitrate de salida para conseguir la mejor relación calidad/productividad. El control de flujo es una herramienta que al mismo tiempo nos permite prevenir situaciones de congestión en la red. Para que un sistema de control de flujo funcione es necesario obtener de la red información acerca del ancho de banda disponible en cada momento (i.e. RTCP receiver reports). Existen diferentes formas de realizar un control de flujo: Cuantización variable (Variable-quantization) Resolución reducida (Reduced resolution) Codificación multinivel (Multi-layer coding) Etc.. 5 2

153 Variabilidad del bitrate. Todos los estándares de compresión de vídeo producen de forma natural un bitstream con tasa de bits variable. Se fija el valor de Qp para obtener una calidad constante. Por contra, se puede variar el Qp (MB, GOB o Frame) para conseguir una tasa de bits constante a costa de una variabilidad en la calidad. La variabilidad viene fijada por la actividad espacial y temporal de la secuencia de vídeo: Un MB de un cuadro P, no se codifica si es muy similar al MB del cuadro de referencia. Dependiendo de la cantidad de movimiento en la escena, el número de MB que NO se codifican varía Variando también el bitrate. La correlación entre los pixels de un bloque de 8x8, dicta el número de bits necesario para codificar los 64 coeficientes resultantes de la transformada. Junto con el valor de Qp determinará el número de coeficiente nulos que aparecen y que posteriormente serán codificados con VLC en flujos bits de tamaño variable. 5 3

154 Variabilidad del bitrate (II). Codes Layers Variable length Fixed length Picture Bit stuffing ESTUF, PSTUF Synchronization Addresing Quant. step size Administrative Spare PSC(22), ECS(22) TR(8), TRB(3) PQUANT(5),DBQUANT(2) PTYPE(3),CPM(),PSBI(2) PEI(), PSPARE(8) Group of Blocks Bit Stuffing GSTUF Synchronization Addresing Administrative Quant. step size GBSC(7) GN(5) GSBI(2), GFID(2) GQUANT(5) Macroblock Administrative Motion MCBPC,MODB, CBPY MVD, MVD2-4, MVDB Administrative Quant. step size COD(), CBPB(6) DQUANT(2) Block DCT Coefficients (except Intra DC terms) TCOEFF DC terms of Intra DCT Coeff. INTRADC(8) Parámetros de longitud fija y variable en un stream de vídeo H.263 La contribución de los parámetros de longitud variable en el bitrate final es mucho mayor que los de longitud fija, a pesar de ser menos. 54

155 Tasa de bits constante. Cuando al red ofrece un servicio de transporte de tipo CBR (i.e ATM), entonces podremos utilizar un control de flujo que proporcione una tasa de bits constante. Es necesario incluir un buffer entre el encoder y la red para suavizar las fluctuaciones del bitrate. Almacenar el video antes de enviarlo aumenta el retardo total, siendo no aconsejable para servicios de entrega de vídeo interactivo. La técnica más común para controlar el flujo de salida del encoder es ajustar sus parámetros de configuración en función de la ocupación del buffer (feedback control). Por otro lado, también podemos regular el flujo con información acerca de la actividad del frame actual (feedforward). Picture activity Modify Encoder Params. Buffer status 5 5 Input Source Encoder Buffe r Output

156 Ajuste de parámetros de codificación. 5 6 Al controlar de flujo de salida de un encoder se debe llegar a un compromiso entre la calidad y la tasa de compresión. Cuando se trata de encoders basados en transformada por bloques, podemos jugar con varios parámetros: Tasa de cuadros (frame rate) Sólo usado cuando la calidad de cada cuadro no puede degradarse. Codificar sólo una parte del bloque de coeficientes (i.e. solo coeff. de baja frecuencia). El coeff. DC siempre debe estar presente. Cuando la información del movimiento es más importante que el detalle espacial Mantener la tasa de cuadros y modificar el parámetro de cuantización Qp. Incrementando Qp se obtendrán mas coeff. nulos, reduciendo los bits necesarios para codificar el bloque usando VLC El ajuste de Qp se puede hacer a nivel de un cuadro, GOB o MB. Umbral de detección de movimiento. Decide si un MB en un cuadro P es codificado o saltado (COD=) Si aumentamos el umbral el encoder se hace menos sensible al movimiento Pocos MB se codifican Reducimos la tasa de bits. Umbral de codificación INTRA de un MB. Decide si un MB es codificado como INTRA (Mayor tasa de bits) o INTER.

157 Cuantización variable. 5 7 El mecanismo de control de flujo más utilizado es: Ajuste del valor de Qp del siguiente cuadro, GOB o MB, basándose en la ocupación actual del buffer (estado de la red). Sin embargo, estos mecanismos ofrecen resultados no predecibles y/o fluctuaciones severas del bitrate: Los distintos umbrales de cuantización (valores Qp) no afectan de forma lineal al bitrate de salida El contenido de vídeo puede afectar a la cantidad de bits necesarios para codificar un frame. Para producir un bitrate estable es necesario emplear algoritmos más complejos, incorporando en muchos casos tanto feedback (buffer-based) como feed-forward control. Un ejemplo: TM5 Rate control algorithm (MPEG-2, H.263, ) Buffer-based

158 58 TM5 rate control algorithm (I). Mecanismo que controla el bitrate calculando de forma adaptativa el valor de Qp para cada MB. Tres pasos: Paso : Estimación de la tasa de bits objetivo para el siguiente cuadro. Se realiza antes de codificar el cuadro Estima de la complejidad global, X, del siguiente cuadro (I, P o B) X i, p, b Si, p, b Qi, p, b donde S indica el número de bits requeridos para codificar el cuadro anterior, y Q es el valor de cuantización medio de todos los MBs El número de bits para el siguiente cuadro, T, se calcula en base al número de bits disponible para el resto del GOP actual, R, y a la complejidad. R se actualiza tras codificar cada frame (inicialmente R = 0) Si es el primer bitrate cuadro N p, b de un GOP (INTRA o I-frame): R R FrameRate Sino (cuadros P y B) R R S i, p, b donde N p,b es el número de cuadros P y B que faltan por codificar en el GOP

159 TM5 rate control algorithm (II). Paso 2: Cálculo del valor Qp de referencia para todos los MBs del cuadro (rate control) Esta basado en la idea de un buffer virtual. Antes de codificar el MB j (j>= ), se calcula el nivel de llenado del buffer virtual (del cuadro actual I, P o B). T,, j i, p, b i, p, b i p b d d d 0 es el valor inicial de llenado del buffer j 0 B j MB_cnt B j es el número de bits generados al codificar los MBs del cuadro hasta el MB j (incluido este) d j es el valor de llenado del buffer al codificar el MB j El valor final del buffer virtual (d i,p,b j cuando j=mb_cnt) se utiliza como valor de llenado inicial para el siguiente cuadro del mismo tipo. d 3 j A continuación Q j se calcula el valor de referencia del cuantizador Q bitrate j para MB j : 2 framerate Paso 3: Determinación del valor del cuantizador (mquant j ) de MB j. Cálculo de la actividad espacial de MB j : Usando el valor de los pixels originales de los cuatro bloques de 8x8 de luminancia (n=..4) y los cuatro bloques de 8x8 de luminancia de los pixels 59

160 60 act j vblk n P k 64 TM5 rate control algorithm (III). P k n son los valores de los pixels en el enésimo bloque de 8x8 Vblk n corresponde a la varianza de los pixels del enésimo bloque de 8x8 Act j es la actividad espacial del MB j A continuación se normaliza la actividad espacial: min vblk vblk 64 n P_mean n k N_act 2, vblk2,..., avg_act es el valor medio de act j en el último cuadro codificado (para el primer cuadro se asigna el valor de 400). Por último, calcula el valor del cuantizador (mquant j ) para MB j : mquant j 2act act j j Q j j avg_act 2avg_act N_act j P_mean El valor de mquant j se recorta para que entre en el intervalo [,3] y se utilice como valor de cuantización de MB j. n k P n k DC n

161 6 Feed-forward rate control. En feed-forward el parámetro de cuantificación se calcula en función de los bits necesarios para codificar el error de predicción del cuadro actual.

162 Control de flujo: Resolución reducida. Para aplicaciones donde se requieren bajas tasas de bits y no es suficiente con la cuantificación variable. Submuestrear cada macrobloque de error antes de codificarlo y realizar la operación inversa (interpolando) en el decodificador. 6 2

163 Control de flujo: Resolución reducida (2). Ejemplo de decodificador H.263 con procesamiento de resolución reducida 6 3

164 Control de flujo: Codificación multinivel. El stream de salida esta formado por un número de codificaciones a distintos niveles de tasa de bits, cuadros por segundo y/o resolución. Nivel Básico + Niveles de mejora. Ejemplo H.26 con dos niveles sobre ATM (992) Básico a muy baja tasa de bits Mejora diferencias con original Ejemplo H.263 con dos niveles (999) Básico QCIF a f/s Mejora CIF a 2 x f/s MPEG-4 soporta multinivel 6 4

165 Control de flujo: Codificación multinivel (2). Ejemplo de MPEG-4, escalabilidad temporal, Qp=cte 6 5

166 Protección y ocultación de errores. Los datos de vídeo codificados son muy sensitivos a la pérdida de información y a los errores de bit del canal. La calidad del video se degrada enormemente ante canales de altos BER a no ser que empleemos mecanismos de control de errores. Las predicciones espacial y temporal de las secuencias de vídeo aumentan la vulnerabilidad. Esquemas de gestión de errores deben situarse en codificador y decodificador No es factible la retransmisión del vídeo erróneo debido a los requisitos de tiempo real 6 6

167 Protección y ocultación de errores (2). Técnicas de ocultación de errores. Sólo interviene el decodificador en el control de errores. El codificador no añade redundancia. El decodificador trata de aprovechar la información que ya tiene libre de errores de la secuencia de video ya recibida para realizar una recuperación aproximada. (a) (b) (c) (d) Sin ocultación Zero-MV MV del frame anterior MV del frame anterior que mejor se mueve en la dirección del MV perdido 6 7

168 Protección y ocultación de errores (3). Técnicas de protección de errores (en el codificador). Inserción de códigos de corrección de errores. Normalmente se aplican a los códigos de longitud fija y se combinan con otras técnicas Duplicación de los vectores de movimiento. Refresco INTRA Refresco INTRA adaptativo (AIR) 6 8 AIR Dos bloques INTRA en cada cuadro

4. Codificación y compresión de audio.

4. Codificación y compresión de audio. 4. Codificación y compresión de audio. 1. Introducción. 2. Características del audio. 2.1 Digitalización. 2.2 Calidad de una señal de audio. 2.3 Parámetros específicos. 3. Compresión de audio. 3.1 Calidad

Más detalles

Tema 6: Codificación y compresión de vídeo.

Tema 6: Codificación y compresión de vídeo. Tema 6: Codificación y compresión de vídeo.. Introducción. 2. Características del vídeo. 2. Captura de vídeo analógico. 2.2 Digitalización. 2.3 Codificación. 2.4 Tipos de vídeo (según su calidad). 2.5

Más detalles

Compresión de Datos Multimedia

Compresión de Datos Multimedia Tema 3 Compresión de Datos Multimedia Introducción La compresión es una manipulación o transformación de la información de entrada, que se realiza antes de transmitirla. El objetivo es enviar la información

Más detalles

Digitalización y compresión de vídeo

Digitalización y compresión de vídeo VdoDig 1 Digitalización y compresión de vídeo Principales normas Algoritmos de compresión Formatos de vídeo VdoDig 2 Normas de vídeo digital H-261.- Videoconferencia Formato de poca resolución y pocas

Más detalles

Tema 2 REPRESENTACIÓN DE LA INFORMACIÓN MULTIMEDIA

Tema 2 REPRESENTACIÓN DE LA INFORMACIÓN MULTIMEDIA Tema 2 REPRESENTACIÓN DE LA INFORMACIÓN MULTIMEDIA Principios de la Digitalización Propiedades de una señal analógica Análisis de Fourier El ancho de banda (bandwidth ) es la frecuencia máxima menos la

Más detalles

Compresión de imágenes

Compresión de imágenes Compresión de imágenes Tipos de imágenes Desde el punto de vista de la compresión Binarias: Blanco y negro. Escala de grises, color y estacionarias de vídeo. Imágenes binarias Presentes en documentos que

Más detalles

Compresión de vídeo. Estándares MPEG

Compresión de vídeo. Estándares MPEG Compresión de vídeo http://www.infoab.uclm.es/asignaturas/42609/te ma4/sld035.htm Estándares MPEG Motion Pictures Expert Group Estándar ISO/IEC JTC1/SC29/WG11 MPEG 1: El primer trabajo del grupo, iniciado

Más detalles

TEMA 2. CODIFICACIÓN DE LA INFORMACIÓN

TEMA 2. CODIFICACIÓN DE LA INFORMACIÓN TEMA 2. CODIFICACIÓN DE LA INFORMACIÓN 1. INTRODUCCIÓN. SISTEMAS DE NUMERACIÓN EN. Sistema binario. Sistema octal. Sistema hexadecimal. 2. REPRESENTACIÓN DE TEXTOS.. Números naturales. Números enteros.

Más detalles

Sistemas de compresión de la imagen (1ª parte)

Sistemas de compresión de la imagen (1ª parte) Sistemas de compresión de la imagen (1ª parte) Módulo 6: Sistemas de compresión... 3 Índice Etapa 1: La necesidad de la compresión... 5 Necesidad de la compresión... 5 Aplicaciones de la compresión...

Más detalles

Sumario. Presentación... 15

Sumario. Presentación... 15 Sumario Presentación... 15 1. INTRODUCCIÓN A LA TELEVISIÓN... 17 1.0. Introducción... 17 1.1. El contexto de la televisión... 18 1.2. Resumen histórico... 21 1.3. Estructura general del sistema de televisión...

Más detalles

Estándar MPEG 2. Estándar MPEG-2

Estándar MPEG 2. Estándar MPEG-2 Estándar MPEG 2 Estándar MPEG-2 El estándar de compresión de vídeo MPEG-2, fue la segunda fase de trabajo realizado por el grupo MPEG. El conjunto de requerimientos fijados: Compatibilidad con MPEG-1 Buena

Más detalles

ENERGÍA. Vibraciones mecánicas. Vibraciones electromagnéticas

ENERGÍA. Vibraciones mecánicas. Vibraciones electromagnéticas ENERGÍA Vibraciones mecánicas SONIDO Vibraciones electromagnéticas LUZ CICLO DE ONDA Amplitud Longitud de onda (l) Inversamente proporcionales; Definen el tono. Frecuencia = CICLOS POR SEGUNDO (HERTZIOS)

Más detalles

Representación y Codificación de Señales Audiovisuales en Televisión Digital MPEG-2 Audio

Representación y Codificación de Señales Audiovisuales en Televisión Digital MPEG-2 Audio Representación y Codificación de Señales Audiovisuales en Televisión Digital MPEG-2 Audio José M. Martínez, SPAIN JoseM.Martinez@uam.es tel:+34.91.497.22.58 2011-2012 INDICE Representación y Codificación

Más detalles

Introducción general a la compresión de datos multimedia

Introducción general a la compresión de datos multimedia Introducción general a la compresión de datos multimedia Necesidad de la compresión La mayoría de las aplicaciones multimedia requieren volúmenes importantes de almacenamiento y transmisión. CD-ROM 640

Más detalles

banda, mayor es la distorsión, y mayor es la probabilidad de que se cometan errores en el receptor.

banda, mayor es la distorsión, y mayor es la probabilidad de que se cometan errores en el receptor. banda, mayor es la distorsión, y mayor es la probabilidad de que se cometan errores en el receptor. Figura 1.10 Componentes en frecuencia de una onda cuadrada (T = 1/f). En la figura 1.11 se muestra una

Más detalles

Tema 3. Compresión de la información de video. Contenidos

Tema 3. Compresión de la información de video. Contenidos Tema 3 Compresión de la información de video Contenidos Introducción La compresión de la señal de vídeo La redundancia en la información de vídeo Métodos de compresión por transformación: la DCT Algunos

Más detalles

Comunicaciones I. Capítulo 4 CODIFICACIÓN Y MODULACIÓN

Comunicaciones I. Capítulo 4 CODIFICACIÓN Y MODULACIÓN Comunicaciones I Capítulo 4 CODIFICACIÓN Y MODULACIÓN 1 Resumen de lo visto en el Capítulo 4 Se analizó la diferencia entre datos analógicos y digitales, y entre señales analógicas y digitales. A partir

Más detalles

Técnicas de codificación en forma de onda

Técnicas de codificación en forma de onda Técnicas de codificación en forma de onda Contenido Introducción prerrequisitos Requisitos Componentes Utilizados Convenciones Modulación de código por impulsos Filtro Muestreo Digitalice la Voz Cuantización

Más detalles

SISTEMAS DE COMUNICACION. Ingeniería en Electrónica Sexto semestre M.C. Maribel Tello Bello 2010-II

SISTEMAS DE COMUNICACION. Ingeniería en Electrónica Sexto semestre M.C. Maribel Tello Bello 2010-II SISTEMAS DE COMUNICACION Ingeniería en Electrónica Sexto semestre M.C. Maribel Tello Bello 2010-II TELEVISIÓN Difusión regular de radio...1920 Difusión regular de TV...1930 Televisión a color (EU)...1953

Más detalles

Redes y Comunicaciones

Redes y Comunicaciones Departamento de Sistemas de Comunicación y Control Redes y Comunicaciones Solucionario Tema 3: Datos y señales Tema 3: Datos y señales Resumen La información se debe transformar en señales electromagnéticas

Más detalles

Principios del Audio Digital

Principios del Audio Digital Principios del Audio Digital Introducción El principio del audio digital consiste en discretizar las señales sonoras (señales contínuas) para convertirlas en secuencias de números La discretización de

Más detalles

Redes y Comunicaciones

Redes y Comunicaciones Departamento de Sistemas de Comunicación y Control Redes y Comunicaciones Solucionario Tema 4: Transmisión digital Tema 4: Transmisión digital Resumen La conversión digital a digital involucra tres técnicas:

Más detalles

TV: TeleVisión Plan 2010 Codificación híbrida: Recomendación ITU-T H.261

TV: TeleVisión Plan 2010 Codificación híbrida: Recomendación ITU-T H.261 TV: TeleVisión Plan 2010 Codificación híbrida: Recomendación ITU-T H.261 TV @ ETSIT-UPM (Plan 2010) H.261-1 Contenido 1. Codificador híbrido. 2. Introducción a H.261. 3. Formato de vídeo en H.261. 4. Codificador

Más detalles

Conceptos básicos de comunicaciones (1)

Conceptos básicos de comunicaciones (1) Conceptos básicos de comunicaciones (1) Area de Ingeniería Telemática http://www.tlm.unavarra.es Redes 4º Ingeniería Informática Temario 1. Introducción a las redes 2. Encaminamiento 3. Transporte extremo

Más detalles

Descripción de la técnica de compresión MP3 para audio

Descripción de la técnica de compresión MP3 para audio Descripción de la técnica de compresión MP3 para audio Óscar Machuca Gómez Manuel Espinosa Candón Técnicas de Adquisición y procesado digital de señales Índice 1. Introducción: Qué es el MP3... 3 2. Descripción

Más detalles

DIPLOMATURA EN TÉCNICA, CONSERVACIÓN Y CATALOGACIÓN FOTOGRÁFICA DE ARCHIVOS DE LA ADMINISTRACIÓN PÚBLICA. Digitalización de imágenes fotográficas

DIPLOMATURA EN TÉCNICA, CONSERVACIÓN Y CATALOGACIÓN FOTOGRÁFICA DE ARCHIVOS DE LA ADMINISTRACIÓN PÚBLICA. Digitalización de imágenes fotográficas DIPLOMATURA EN TÉCNICA, CONSERVACIÓN Y CATALOGACIÓN FOTOGRÁFICA DE ARCHIVOS DE LA ADMINISTRACIÓN PÚBLICA MÓDULO DE CONFERENCIA Digitalización de imágenes fotográficas PROCESOS DE UN PROYECTO DE DIGITALIZACIÓN

Más detalles

La Modulación. Ing. Carlos Eduardo Molina C.

La Modulación. Ing. Carlos Eduardo Molina C. La Modulación La amplia naturaleza de las señales analógicas es evidente, cualquier forma de onda está disponible con toda seguridad en el ámbito analógico, nos encontramos con una onda original y una

Más detalles

Acústica del Habla. Introducción a las Tecnologías del Habla 2 o cuatrimestre 2014 Agustín Gravano

Acústica del Habla. Introducción a las Tecnologías del Habla 2 o cuatrimestre 2014 Agustín Gravano Acústica del Habla Introducción a las Tecnologías del Habla 2 o cuatrimestre 2014 Agustín Gravano Repaso clase anterior Procesamiento del Habla Construir sistemas informáticos capaces de manipular efectivamente

Más detalles

Tema 2. Principios de la Digitalización

Tema 2. Principios de la Digitalización Tema 2 REPRESENTACIÓN DE LA INFORMACIÓN MULTIMEDIA Principios de la Digitalización Propiedades de una señal analógica Análisis de Fourier El ancho de banda (bandwidth ) es la frecuencia máxima menos la

Más detalles

Europa. 60/ 30 Alta res. 24/ 24 Alta res. DVD. Televisión

Europa. 60/ 30 Alta res. 24/ 24 Alta res. DVD. Televisión Norm ativa NTSC Lineas Filas 525 Asp ect 4:3 Frec. Campo /cuadro [Hz] 60/30 Uso Televisión EE:UU Color calidad trasmisión (YCrCb) 4:2:2 Entrelazado si PAL 625 4:3 50/ 25 Televisión Europa 4:2:2 si HDT

Más detalles

Computadores y Comunicaciones. Tema 6: Aplicaciones Multimedia

Computadores y Comunicaciones. Tema 6: Aplicaciones Multimedia Computadores y Comunicaciones Tema 6: Aplicaciones Multimedia Febrero, 2011 Jorge Juan Chico , Julián Viejo Cortés Departamento de Tecnología Electrónica Universidad

Más detalles

Códigos IRA. Máster en Multimedia y Comunicaciones Comunicaciones Digitales. Luca Martino

Códigos IRA. Máster en Multimedia y Comunicaciones Comunicaciones Digitales. Luca Martino Códigos IRA Máster en Multimedia y Comunicaciones Comunicaciones Digitales Luca Martino Codificación de Canal! Supongamos tener un canal binario discreto, simétrico sin memoria:! Objetivo: encontrar una

Más detalles

3. Espacios de color. 3.Espacios de color. El uso del color en el procesamiento de imágenes está principalmente motivado por dos factores:

3. Espacios de color. 3.Espacios de color. El uso del color en el procesamiento de imágenes está principalmente motivado por dos factores: 3. Espacios de color El uso del color en el procesamiento de imágenes está principalmente motivado por dos factores: El color es un poderoso descriptor que, en la mayoría de los casos simplifica la identificación

Más detalles

COMPRESIÓN DE AUDIO. 1. Introducción. 2. Codificación IMA ADPCM PRÁCTICAS TXÓN. DATOS MULTIMEDIA

COMPRESIÓN DE AUDIO. 1. Introducción. 2. Codificación IMA ADPCM PRÁCTICAS TXÓN. DATOS MULTIMEDIA PRÁCTICAS TXÓN. DATOS MULTIMEDIA COMPRESIÓN DE AUDIO 1. Introducción En esta práctica vamos a tratar la compresión de audio. En concreto vamos a estudiar la conversión de una serie de muestras de audio

Más detalles

Transmisión Digital (60123) Fredy Castellanos - UNET -

Transmisión Digital (60123) Fredy Castellanos - UNET - Especialización en Telecomunicaciones Transmisión Digital (60123) 1 Transmisión Digital Ventajas: Inmunidad al Ruido Mejor Procesamiento y Multicanalización Utilización de Regeneración en lugar de Amplificación

Más detalles

Redes de Computadores

Redes de Computadores Dpto. Ingeniería Div. Ingeniería de Sistemas y Automática Redes de Computadores CONCEPTOS BÁSICOS DE TRANSMISIÓN DE DATOS 1 Objetivos Introducir los conceptos básicos relativos a la transmisión de datos

Más detalles

Sistema de conocimientos Definición de sonido y video digital. Formatos de sonido Formatos de video Procesamiento digital de sonido y video.

Sistema de conocimientos Definición de sonido y video digital. Formatos de sonido Formatos de video Procesamiento digital de sonido y video. Sonido y audio Digital Sistema de conocimientos Definición de sonido y video digital. Formatos de sonido Formatos de video Procesamiento digital de sonido y video. Introducción El sonido es una de las

Más detalles

TELECONTROL Y AUTOMATISMOS

TELECONTROL Y AUTOMATISMOS TELECONTROL Y AUTOMATISMOS ACONDIDIONADORES DE SEÑAL 4. Acondicionamiento de Señal. La señal de salida de un sistema de medición en general se debe procesar de una forma adecuada para la siguiente etapa

Más detalles

AUDIO DIGITAL. Diego Cabello Ferrer Dpto. Electrónica y Computación Universidad de Santiago de Compostela

AUDIO DIGITAL. Diego Cabello Ferrer Dpto. Electrónica y Computación Universidad de Santiago de Compostela AUDIO DIGITAL Diego Cabello Ferrer Dpto. Electrónica y Computación Universidad de Santiago de Compostela 1. Introducción Señal de audio: onda mecánica Transductor: señal eléctrica Las variables físicas

Más detalles

Francisco J. Hernández López

Francisco J. Hernández López Francisco J. Hernández López fcoj23@cimat.mx Proviene del verbo latino video, vides, videre que se traduce como el verbo ver Tecnología desarrollada por primera vez para los sistemas de TV, pero actualmente

Más detalles

IES Abyla. Departamento de Informática. Sonido digital

IES Abyla. Departamento de Informática. Sonido digital Sonido digital Conceptos básicos El sonido digital es el resultado de un proceso de captura del sonido original, normalmente por medio de un micrófono conectado al ordenador. A este proceso se le denomina

Más detalles

Cada frame completo tiene 625 líneas de cada una de las de arriba que se pueden representar todas juntas, una encima de otra.

Cada frame completo tiene 625 líneas de cada una de las de arriba que se pueden representar todas juntas, una encima de otra. Fundamentos de tecnología de video 1. Funcionamiento básico de la imagen de video 1.1. La imagen de video analógica: La imagen de video analógica se forma con la sucesión de un número determinado de imágenes

Más detalles

Examen Final Televisión Digital 12 de junio de 2008 TELEVISIÓN DIGITAL 2007/08

Examen Final Televisión Digital 12 de junio de 2008 TELEVISIÓN DIGITAL 2007/08 Examen Final Apellidos, nombre DNI TELEVISIÓN DIGITAL 2007/08 12 de junio de 2008 Calificación Lea atentamente estas instrucciones y no de la vuelta a esta hoja hasta que se le indique Este examen está

Más detalles

MULTIPLEX PCM DE 4 CANALES CON CODIFICACION DE LINEA AMI/HDB3/CMI Módulo T20F-E/EV

MULTIPLEX PCM DE 4 CANALES CON CODIFICACION DE LINEA AMI/HDB3/CMI Módulo T20F-E/EV MULTIPLEX PCM DE 4 CANALES CON CODIFICACION DE LINEA AMI/HDB3/CMI Módulo T20F-E/EV TEORIA Y EJERCICIOS INDICE 1. ASPECTOS GENERALES del PCM 1.1 OBJETIVOS 1.2 NOCIONES TEORICAS 1.2.1 Introducción 1.2.2

Más detalles

Soportes de almacenamiento digital en vídeo

Soportes de almacenamiento digital en vídeo Tema 4 Soportes de almacenamiento digital en vídeo Contenidos Introducción Corrección de errores Grabación sobre cinta Unidades de disco magnético Magnetoscopios híbridos Unidades de disco óptico Bibliografía

Más detalles

ASÍ FUNCIONA LA CONVERSIÓN ANALÓGICO- DIGITAL DIGITALIZACIÓN DE LA SEÑAL ANALÓGICA

ASÍ FUNCIONA LA CONVERSIÓN ANALÓGICO- DIGITAL DIGITALIZACIÓN DE LA SEÑAL ANALÓGICA ASÍ FUNCIONA LA CONVERSIÓN ANALÓGICO- DIGITAL DIGITALIZACIÓN DE LA SEÑAL ANALÓGICA En una señal eléctrica analógica, los valores de tensión positivos y negativos pueden mantenerse con un valor constante,

Más detalles

TRANSMISION DIGITAL. PCM, Modulación por Codificación de Pulsos

TRANSMISION DIGITAL. PCM, Modulación por Codificación de Pulsos MODULACIÓN TRANSMISION DIGITAL La amplia naturaleza de las señales analógicas es evidente, cualquier forma de onda está disponible con toda seguridad en el ámbito analógico, nos encontramos con una onda

Más detalles

Procesos Multimedia: Captura y Reproducción. Septiembre de 2016

Procesos Multimedia: Captura y Reproducción. Septiembre de 2016 Captura Procesos Multimedia: Captura.. carlos.andres.delgado@correounivalle.edu.co Facultad de Ingeniería. Universidad del Valle Septiembre de 2016 Contenido Captura 1 Captura 2 3 Captura reproducción

Más detalles

En algunas ocasiones se utiliza una cuarta parte de la imagen CIF, que se conoce por la abreviatura QCIF (Quarter CIF: cuarta parte de CIF).

En algunas ocasiones se utiliza una cuarta parte de la imagen CIF, que se conoce por la abreviatura QCIF (Quarter CIF: cuarta parte de CIF). Resolución La resolución en un mundo digital o analógico es parecida, pero existen algunas diferencias importantes sobre su definición. En el video analógico, la imagen consiste en líneas, o líneas de

Más detalles

Normas ISO de codificación de contenidos audiovisuales. -MPEG 1, MPEG-2, MPEG-4, MPEG 7 y MPEG 21-

Normas ISO de codificación de contenidos audiovisuales. -MPEG 1, MPEG-2, MPEG-4, MPEG 7 y MPEG 21- Normas ISO de codificación de contenidos audiovisuales -MPEG 1, MPEG-2, MPEG-4, MPEG 7 y MPEG 21-1 La familia MPEG MPEG 1 (1992): codificación digital de audio y vídeo hasta 1.5 Mbit/s para almacenamiento

Más detalles

Victrola de La Transformada de Fourier

Victrola de La Transformada de Fourier Victrola de La Transformada de Fourier p. 1/2 Victrola de La Transformada de Fourier Introducción para Músicos Juan I Reyes juanig@maginvent.org artelab Laboratorios de Artes Electrónicas Victrola de La

Más detalles

TDM Time Division Multiplexing Multiplexación por división en tiempo Trama E1

TDM Time Division Multiplexing Multiplexación por división en tiempo Trama E1 TDM Time Division Multiplexing Multiplexación por división en tiempo Trama E1 Marzo 2013 José R. Salvador TDM Multiplexaciónpor división en tiempo Trama E1 Indice TDM (Time Division Multiplexing) La trama

Más detalles

2 TÉCNICAS DE COMPRESIÓN DE LA SEÑAL DE VÍDEO

2 TÉCNICAS DE COMPRESIÓN DE LA SEÑAL DE VÍDEO 2 TÉCNICAS DE COMPRESIÓN DE LA SEÑAL DE VÍDEO La compresión es el proceso de compactar los datos en un menor número de bits. En el caso de la compresión de vídeo hemos dicho que necesitamos disminuir la

Más detalles

DESCRIPCIÓN DEL PRODUCTO

DESCRIPCIÓN DEL PRODUCTO SISTEMAS DE CATV AGENDA OBJETIVOS DE APRENDIZAJE REPASO TECNOLÓGICO DESCRIPCIÓN DEL PRODUCTO ASPECTOS TÉCNICOS ASPECTOS COMERCIALES SESIÓN DE PREGUNTAS OBJETIVOS DE APRENDIZAJE Al terminar la presentación,

Más detalles

Última modificación: 1 de septiembre de

Última modificación: 1 de septiembre de Contenido 1.- Analógico y digital. DATOS Y SEÑALES 2.- Señales analógicas periódicas. 3.- Señales compuestas. 4.- Señales digitales. Objetivo.- Al finalizar el tema, el estudiante será capaz de usar representaciones

Más detalles

3. Compresión de vídeo. 3.1 Redundancia temporal. 3.2 Estimación de movimiento. 3.3 Estándares: MPEG y H.261. 4. Conclusiones.

3. Compresión de vídeo. 3.1 Redundancia temporal. 3.2 Estimación de movimiento. 3.3 Estándares: MPEG y H.261. 4. Conclusiones. Tema 6: Codificación y compresión de vídeo. 1. Introducción. 2. Características del vídeo. 2.1 Captura de vídeo analógico. 2.22 Digitalización. it ió 2.3 Codificación. 2.4 Tipos de vídeo (según su calidad).

Más detalles

La integración de sonido e imagen Producción multimedia CAV-CLP 1

La integración de sonido e imagen Producción multimedia CAV-CLP 1 La integración de sonido e imagen Producción multimedia CAV-CLP 1 El oído humano no está dotado para percibir todos los sonidos Se halla limitado a percibir sonidos que a partir de 20 Hz hasta 20.000 Hz.

Más detalles

Técnicas de Compresión de Datos:

Técnicas de Compresión de Datos: Técnicas de Compresión de Datos: La técnica más simple de codificar es PCM. Con ella se logra transmitir voz digital a una velocidad de 64Kbps (8bits/muestra, 8000 muestras/segundo). En algunas aplicaciones,

Más detalles

SEÑAL DIGITAL

SEÑAL DIGITAL SEÑAL DIGITAL 0110 0001 0000 0111 0110 1111 0010 QUÉ ES LA SEÑAL DIGITAL? La señal digital es un tipo de señal generada por algún tipo de fenómeno electromagnético en que cada signo que codifica el contenido

Más detalles

INTRODUCCIÓN Videoconferencia sobre Frame Relay

INTRODUCCIÓN Videoconferencia sobre Frame Relay INTRODUCCIÓN Videoconferencia sobre Frame Relay Homero Andrango María Fernanda Jerez Patricia Yacelga Se denomina videoconferencia al sistema que permite a un grupo de personas ubicadas en lugares distantes

Más detalles

Tema / La capa de enlace de datos: entramado y detección de errores

Tema / La capa de enlace de datos: entramado y detección de errores Tema 2 6.263 / 16.37 La capa de enlace de datos: entramado y detección de errores MIT, LIDS Diapositiva 1 Capa de enlace de datos (DLC) Responsable de la transmisión fiable de paquetes en un enlace: Entramado:

Más detalles

Teoria de las Telecomunicaciones. TEMA 2 Tècnicas de modulacion. Luis Lujan

Teoria de las Telecomunicaciones. TEMA 2 Tècnicas de modulacion. Luis Lujan Teoria de las Telecomunicaciones TEMA 2 Tècnicas de modulacion Luis Lujan 1 Índice Técnicas de codificación: Datos digitales: Señales digitales. Señales analógicas. Datos analógicos: Señales digitales.

Más detalles

Sistemas de Comunicaciones

Sistemas de Comunicaciones Sistemas de Comunicaciones Tema 1: Introducción Grado en Ingeniería de Sistemas de Telecomunicación Departamento de Ingeniería de Comunicaciones Universidad de Málaga Curso 2012/2013 Tema 1: Introducción

Más detalles

UNIDAD I.- INTRODUCCIÓN A LA GRAFICACIÓN POR COMPUTADORA

UNIDAD I.- INTRODUCCIÓN A LA GRAFICACIÓN POR COMPUTADORA UNIDAD I.- INTRODUCCIÓN A LA GRAFICACIÓN POR COMPUTADORA LECCIÓN 1.3.- Formatos gráficos de almacenamiento 1.3.1.- Formatos de archivos para gráficos Son formas estándarizadas para almacenar imágenes.

Más detalles

Tratamiento de imágenes Adquisición y Digitalización

Tratamiento de imágenes Adquisición y Digitalización Tratamiento de imágenes Adquisición y Digitalización hamontesv@uaemex.mx http://scfi.uaemex.mx/hamontes Advertencia No use estas diapositivas como referencia única de estudio durante este curso. La información

Más detalles

Prof. María L. Calvo Clase del 23 y 24 de abril de 2012

Prof. María L. Calvo Clase del 23 y 24 de abril de 2012 Teoría de la señal: Fundamentos de señales óptica Prof. María L. Calvo Clase del 23 y 24 de abril de 2012 Definición Qué entendemos por Tratamiento de señales? Operaciones lógicas: suma, resta, multiplicación,

Más detalles

El IRTP cuenta con dos sistemas satelitales FlyAway en la banda KU para. realizar transmisiones en vivo y en directo de diferentes puntos de nuestro

El IRTP cuenta con dos sistemas satelitales FlyAway en la banda KU para. realizar transmisiones en vivo y en directo de diferentes puntos de nuestro 14.- SISTEMAS SATELITALES FLYAWAY El IRTP cuenta con dos sistemas satelitales FlyAway en la banda KU para realizar transmisiones en vivo y en directo de diferentes puntos de nuestro territorio nacional

Más detalles

51 Int. CI.: H04N 7/14 ( ) TRADUCCIÓN DE PATENTE EUROPEA

51 Int. CI.: H04N 7/14 ( ) TRADUCCIÓN DE PATENTE EUROPEA 19 OFICINA ESPAÑOLA DE PATENTES Y MARCAS ESPAÑA 11 Número de publicación: 2 49 747 1 Int. CI.: H04N 7/14 (06.01) 12 TRADUCCIÓN DE PATENTE EUROPEA T3 96 Fecha de presentación y número de la solicitud europea:

Más detalles

1. Introducción a las comunicaciones

1. Introducción a las comunicaciones 1. Introducción a las comunicaciones Introducción 1.1. Conceptos básicos de transmisión de datos 1.2. Medios de Transmisión. Capacidad de un canal 1.3 Técnicas de transmisión 1.4 Distribución de ancho

Más detalles

Compresión de Vídeo. Juan A. Michell Mar>n Gustavo A. Ruiz Robredo. Tema 2.8. Otras caracterís/cas. Departamento de Electrónica y Computadores

Compresión de Vídeo. Juan A. Michell Mar>n Gustavo A. Ruiz Robredo. Tema 2.8. Otras caracterís/cas. Departamento de Electrónica y Computadores Tema 2.8. Otras caracterís/cas Juan A. Michell Mar>n Gustavo A. Ruiz Robredo Departamento de Electrónica y Computadores Este tema se publica bajo Licencia: Crea9ve Commons BY- NC- SA 4.0 Si los parámetros

Más detalles

Laboratorio de Procesamiento Digital de Voz Practica 4 CUANTIZACION ESCALAR, LOGARITMICA, (A)DM y (A)DPCM

Laboratorio de Procesamiento Digital de Voz Practica 4 CUANTIZACION ESCALAR, LOGARITMICA, (A)DM y (A)DPCM Laboratorio de Procesamiento Digital de Voz Practica 4 CUANTIZACION ESCALAR, LOGARITMICA, (A)DM y (A)DPCM Objetivos: Manejar los conceptos de cuantización escalar, logarítmica y manejo de cuantizadores

Más detalles

Procesamiento de Señales Digitales

Procesamiento de Señales Digitales Procesamiento de Señales Digitales La IEEE* Transactions on Signal Processing establece que el término señal incluye audio, video, voz, imagen, comunicación, geofísica, sonar, radar, médica y señales musicales.

Más detalles

3. Señales. Introducción y outline

3. Señales. Introducción y outline 3. Señales Introducción y outline Outline Señales y Sistemas Discretos: SLIT, Muestreo, análisis tiempo-frecuencia, autocorrelación, espectro, transformada Z, DTFT, DFT, FFT Filtros y Estimación: Filtros

Más detalles

6 Estándares de compresión de vídeo

6 Estándares de compresión de vídeo 6 Estándares de compresión de vídeo Los codecs de vídeo más importantes para la transmisión de un flujo de información visual (streaming video) por la red son MJPEG, H.261, H.263, MPEG1, MPEG2 y MPEG4.

Más detalles

a) Funcionalidad del servicio de vídeo. La funcionalidad de los servicios de vídeo, está estrictamente vinculado a los formatos de este.

a) Funcionalidad del servicio de vídeo. La funcionalidad de los servicios de vídeo, está estrictamente vinculado a los formatos de este. Servicios de video. El vídeo es la tecnología de la captación, grabación, procesamiento, almacenamiento, transmisión y reconstrucción por medios electrónicos digitales o analógicos de una secuencia de

Más detalles

INTRODUCCION A LA COMPRESION DE IMAGEN

INTRODUCCION A LA COMPRESION DE IMAGEN INTRODUCCION A LA COMPRESION DE IMAGEN Constantino Pérez Vega Dpto. de Ingeniería de Comunicaciones Curso 2009-2010 inicio de blanking horizontal Inicio de línea digital activa T(ns) = 1000/13.5 OH 12T

Más detalles

Clase 4: Cuantificación. Eytan Modiano Departamento de astronáutica y aeronáutica. Eytan Modiano Slide 1

Clase 4: Cuantificación. Eytan Modiano Departamento de astronáutica y aeronáutica. Eytan Modiano Slide 1 Clase 4: Cuantificación Departamento de astronáutica y aeronáutica Slide 1 Muestreo El muestreo facilita una representación en tiempo discreto de una forma de onda continua Los puntos de muestreo son números

Más detalles

VoIP: Una Puerta hacia la Convergencia. Page 1

VoIP: Una Puerta hacia la Convergencia. Page 1 VoIP: Una Puerta hacia la Convergencia Page 1 Introducción a VoIP La Voz sobre IP, es el envío, en tiempo real, de voz entre dos o más participantes a través de redes, usando protocolos estándares de Internet,

Más detalles

01/10/2010. 3. Señales, codificación y modulación. Contenido. a. Señales digitales. a. Señales digitales b. Conversión digital a digital

01/10/2010. 3. Señales, codificación y modulación. Contenido. a. Señales digitales. a. Señales digitales b. Conversión digital a digital 3. Señales, codificación y modulación Contenido a. Señales digitales b. Conversión digital a digital c. Conversión esó analógico aógcoadga digital d. Conversión digital a analógico e. Conversión analógico

Más detalles

UD - 6 SISTEMAS DE COMPRENSIÓN DE IMÁGENES

UD - 6 SISTEMAS DE COMPRENSIÓN DE IMÁGENES UD - 6 SISTEMAS DE COMPRENSIÓN DE IMÁGENES Eduard Lara 1 1. INTRODUCCIÓN La digitalización de las imágenes de TV genera una alta cantidad de información Tratamiento y distribución complicado. Necesidad

Más detalles

Servicio de audio. Tema 8 SRI. Vicente Sánchez Patón. I.E.S Gregorio Prieto

Servicio de audio. Tema 8 SRI. Vicente Sánchez Patón. I.E.S Gregorio Prieto Servicio de audio Tema 8 SRI Vicente Sánchez Patón I.E.S Gregorio Prieto Funcionalidad del servicio de audio La función del servicio de audio es transmitir sonido (audio) desde un punto a otro, ya sea

Más detalles

2 de mar de 2004 Codificación de imágenes y v ideo

2 de mar de 2004 Codificación de imágenes y v ideo Teoría de la Información 2 de mar de 2004 Codificación de imágenes y v ideo 2 de mar de 2004 Codificación de imágenes y video 2 El clima en el Río de la Plata...... N L N N L S N... N L L T L L L... N

Más detalles

8 Sistemas de televisión n digital

8 Sistemas de televisión n digital 8 Sistemas de televisión n digital 1 Digitalización n de imágenes 2 Formación n de la trama digital 3 Transmisión n de la trama 4 Medidas de calidad en video digital 5 Compresión n de imágenes genes: :

Más detalles

Tecnologías de la imagen II

Tecnologías de la imagen II Tecnologías de la imagen II VÍDEO DIGITAL Conceptos iniciales Formatos y compresión de vídeo Eva Sales / Grado BBAA / Curso 2015-16 VÍDEO DIGITAL. Conceptos iniciales. NTSC vs. PAL VÍDEO DIGITAL. Conceptos

Más detalles

Modulación. Modulación n AM. Representación n en el Tiempo y en Frecuencia

Modulación. Modulación n AM. Representación n en el Tiempo y en Frecuencia Objetivos Unidad III Técnicas de Modulación n y Conversión n Análoga loga-digital Definir, describir, y comparar las técnicas de modulación analógica y digital. Definir y describir la técnica de conversión

Más detalles

Introducción a las imágenes digitales. Segunda parte

Introducción a las imágenes digitales. Segunda parte Introducción a las imágenes digitales Segunda parte Introducción a las imágenes digitales Herramientas matemáticas. Transformaciones de intensidad. Histograma de una imagen. Imágenes a color. Modelos de

Más detalles

Almacenamiento de imágenes digitales. Primera parte

Almacenamiento de imágenes digitales. Primera parte Almacenamiento de imágenes digitales Primera parte Representación de Imágenes Digitales Representar una imagen de n x n píxeles mediante una matriz requiere: n 2 bits si es binaria n 2 log 2 (L) bits si

Más detalles

2.5.6 CODIFICACIÓN PARA EL FORMATO DES CARACTERÍSTICAS GENERALES DEL ESTÁNDAR HEVC Ó H Metodología

2.5.6 CODIFICACIÓN PARA EL FORMATO DES CARACTERÍSTICAS GENERALES DEL ESTÁNDAR HEVC Ó H Metodología Índice Índice... 3 Índice de Figuras... 5 Índice de Tablas... 7 1 Introducción... 8 1.1 CONTEXTO... 8 1.2 OBJETIVO... 8 2 Conceptos básicos... 10 2.1 VISIÓN 3D... 10 2.1.1 PRINCIPIOS FÍSICOS DE LA VISIÓN

Más detalles

1. Sistemas de televisión extendidas:

1. Sistemas de televisión extendidas: Introducción al vídeo Este material supone solo una ampliación de la cultura general de cada alumno. No pretende de rigor o exactitud, pero es necesario para entender el resto del material de vídeo. 1.

Más detalles

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 15

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 15 Procesamiento Digital de Imágenes Pablo Roncagliolo B. Nº 15 Orden de las clases... CAPTURA, DIGITALIZACION Y ADQUISICION DE IMAGENES TRATAMIENTO ESPACIAL DE IMAGENES TRATAMIENTO EN FRECUENCIA DE IMAGENES

Más detalles

CAPITULO II. Las imágenes en movimiento están formadas por gran cantidad de fotogramas con

CAPITULO II. Las imágenes en movimiento están formadas por gran cantidad de fotogramas con CAPITULO II FUNDAMENTOS TEÓRICOS DE LA TELEVISIÓN 2.1 Señal de video Las imágenes en movimiento están formadas por gran cantidad de fotogramas con cierta continuidad, que al ser mostradas una detrás de

Más detalles

Palabras Claves: Compensación de movimiento, estimación de movimiento, segmentación, video, MPEG, Tiempo Real.

Palabras Claves: Compensación de movimiento, estimación de movimiento, segmentación, video, MPEG, Tiempo Real. Estimación y Compensación de Movimientos en Video Codificado Claudia Cecilia Russo 1 - Hugo Ramón 2 LIDI - Laboratorio de Investigación y Desarrollo en Informática Facultad de Informática Universidad Nacional

Más detalles

TECNOLOGIA DE VIDEO DE ALTA DEFINICION

TECNOLOGIA DE VIDEO DE ALTA DEFINICION TECNOLOGIA DE VIDEO DE ALTA DEFINICION Ing. Bernardo Vértiz Díaz Gerente de Proyectos TELVICOM S.A. ILUSION DE MOVIMIENTO 1 2 3 22 23 24 EN CINE SE TRANSMITEN 24 CUADROS POR SEGUNDO CADA CUADRO RECIBE

Más detalles

Servicios de video. Tema 8 SRI. Vicente Sánchez Patón. I.E.S Gregorio Prieto

Servicios de video. Tema 8 SRI. Vicente Sánchez Patón. I.E.S Gregorio Prieto Servicios de video Tema 8 SRI Vicente Sánchez Patón I.E.S Gregorio Prieto Funcionalidad del servicio de video El video es la tecnología de la captación, grabación, procesamiento, almacenamiento, transmisión

Más detalles

Técnicas de codificación en forma de onda

Técnicas de codificación en forma de onda Técnicas de codificación en forma de onda Contenido Introducción prerrequisitos Requisitos Componentes Utilizados Convenciones Modulación de código por impulsos Filtro Muestreo Digitalice la Voz Cuantización

Más detalles

Sonido digital. Características: altura, timbre e intensidad:

Sonido digital. Características: altura, timbre e intensidad: Sonido digital Podemos definir al sonido como la interpretación que hace nuestro cerebro de las variaciones de presión que genera un objeto vibrante en determinado medio, habitualmente, el aire, sobre

Más detalles

Introducción al procesamiento digital de señales en tiempo real

Introducción al procesamiento digital de señales en tiempo real Introducción al procesamiento digital de señales en tiempo real ELO 385 Laboratorio de Procesamiento Digital de Señales Segundo semestre - 2011 Matías Zañartu, Ph.D. Departamento de Electrónica Universidad

Más detalles

Audio digital. 1) Captura y codificación. 2) Formatos de sonido digital. 3) Grabador de sonido. 4) Extractor de música.

Audio digital. 1) Captura y codificación. 2) Formatos de sonido digital. 3) Grabador de sonido. 4) Extractor de música. Audio digital 1) Captura y codificación 2) Formatos de sonido digital 3) Grabador de sonido 4) Extractor de música. Sound Juicer 5) Edición de sonido digital. Audacity Captura y codificación del sonido

Más detalles

Formatos de audio y vídeo: códecs

Formatos de audio y vídeo: códecs Formatos de audio y vídeo: códecs Antonio Yáñez Izquierdo Octubre 2011 Antonio Yáñez Izquierdo () Formatos de audio y vídeo: códecs Octubre 2011 1 / 23 Formatos de audio y vídeo: códecs Códecs Códecs Códecs

Más detalles

Roberto Serrano Garcia. 23/octubre/2016. Tarea #7. Tipos de formatos de Audio (30)

Roberto Serrano Garcia. 23/octubre/2016. Tarea #7. Tipos de formatos de Audio (30) Roberto Serrano Garcia 23/octubre/2016 Tarea #7 Tipos de formatos de Audio (30) GSM Diseñado para el uso de telefonía en Europa. gsm es un formato muy práctico para voces de calidad teléfono. Es un buen

Más detalles