Banda Ancha Compresión, Almacenamiento y Transmisión Eficiente de Señales de Voz, Video y Datos MSc. Luis Rojas
INTRODUCCIÓN Para el almacenamiento y transmisión eficiente de señales de voz, video y texto se utilizan técnicas de codificación fuente y de canal. La codificación fuente comprime eficientemente las señales mediante la eliminación de sus partes redundantes e irrelevantes.
CONTENIDO Modelo de un sistema de telecomunicaciones. Teoría de señales aleatorias. Probabilidad. Variables aleatorias. Procesos Estadísticos. Teoría de la Información. Modelos fuentes. Codificación fuente. Modelos de Canal. Codificación de Canal.
Modelo de un Sistema de Comunicación Haciendo uso de modelos matemáticos se pueden analizar, diseñar o comparar sistemas de comunicación tal como lo muestra el diagrama de bloques siguientes: Fuente Codificación Fuente Codificación de Canal Perturbación Canal Destino Decodificación Fuente Decodificación de Canal
Modelos Fuente y Codificación Fuente La Teoría de la Información modela la señal fuente mediante procesos aleatorio o estocástico. Una información se puede dividir en cuatro partes : Una línea horizontal divide la parte relevante (significativa) de la parte irrelevante (no significativa). Cada línea vertical divide la parte redundante (conocida) de la parte no redundante (desconocida). Solamente la parte interesante debe transmitirse al receptor. La tarea de la codificación fuente es eliminar tanto la parte redundante así de la parte irrelevante de la información por transmitir.
Modelos Fuente y Codificación Fuente Redundante (conocida) R No redundante (desconocida) H Irrelevante (no significativa) Relevante (significativa) Interesante Planos de información según Schouten
Modelos Fuente y Codificación Fuente Las ecuaciones asociadas son: El valor del contenido de decisión Ho referido a un solo símbolo a k del conjunto de k símbolos es: Ho = Log 2 K (bit/símbolo) 1.1 El contenido de decisión está constituido por la redundancia R y el contenido de información H: Ho = R+H 1.2 El contenido de información I(a k ) del símbolo a k se define de la siguiente manera: I (a k ) = log 2 P(a k ) (bit) 1.3 El contenido de información medio del conjunto de símbolos a 1,... a k... a k se calcula de la siguiente manera: K H = -? p(a k ). Log 2 p(a k ) (bit/símbolo) 1.4 K=1
Modelo de Canal Canal discreto utilizando un canal no discreto Canal Discreto Fuente Codificador de Fuente Codificador de Canal Modulador Símbolos binarios Símbolos binarios Canal Perturbación Destino Decodificador de Fuente Decodificador de Canal Demodulador
Código Reversible Un código reversible debe satisfacer ciertas condiciones: Símbolos fuente u Probabilida d p(u) Código I Código II Código III Código IV A 1 A 2 A 3 A 4 0.5 0.25 0.125 0.125 0 0 1 10 0 1 00 11 0 10 110 111 0 01 011 0111
Codificación Fuente Para Facsímil Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina run length coding. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes I 6 I 3 I 7 I 2 I
Algoritmo de Codificación Huffman El algoritmo desarrollado por Huffman en 1962 para el cálculo de códigos de prefijos con redundancia mínima, consiste en: 1.- Ordenar los símbolos fuente de mayor a menor probabilidad. 2.- Unir a los dos símbolos fuentes menos probables en un símbolo de ayuda y calcular su probabilidad. 3.- Ordenar los símbolos de ayuda y los resultantes símbolos fuente nuevamente de menor a mayor probabilidad y unir los dos símbolos de menor probabilidad en un nuevo símbolo de ayuda y calcular su probabilidad. 4.- Repetir el paso 3 hasta que aparezca un símbolo con la probabilidad 1. 5.- Si se representa la unión de símbolos a través de líneas se obtiene el árbol de codificación de un código de prefijo con k nodos de terminación. Cada nodo posee dos ramas. A cada rama de un nodo se le asigna uno de los dos símbolos de código: 0,1.
Algoritmo de Codificación Huffman De la asignación de ceros y unos, resulta la palabra de código de cada símbolo fuente.
CODIFICACIÓN FUENTE PARA FAXIMIL Para la transmisión de señales de fax en blanco y negro cada línea de la señal de video se muestra y cada muestra se cuantiza utilizando un valor de amplitud blanco y negro. Cada muestra presenta un punto blanco y negro. Cada punto tiene un contenido de decisión Ho = 1 bit. Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina run length coding. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes.
CODIFICACIÓN FUENTE PARA FAXIMIL Si se modelan las longitudes mediante una fuerte discreta sin memoria y además se asume que las longitudes son estadísticamente independientes, entonces el contenido medio de información de las longitudes blancas y negras se pueden expresar de la siguiente manera: 6 3 7 2
CONDICIÓN DE FAXIMIL Si se modelan las longitudes mediante una fuente discreta sin memoria y además se asume que las longitudes son estadísticamente independientes, entonces el contenido medio de información de las longitudes blancas y negras se pueden expresar de la siguiente manera. r max Hb = -? pb ( r ). log 2 pb ( r ) r=1 r max Hn = -? pn ( r ). log 2 pn ( r ) r=1
CONDICIÓN DE FAXIMIL Para reducir la complejidad del equipo se codifican solamente las primeras 63 longitudes según Huffman. Las longitudes más grandes son representadas utilizando dos palabras de códigos, donde la primera parte representa la longitud r.64 y la segunda parte el resto de la longitud la cual puede ser cero. º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º
CODIFICACIÓN FUENTE PARA FAXIMIL Para la transmisión de señales de fax en blanco y negro cada línea de la señal de video se muestra y cada muestra se cuantiza utilizando un valor de amplitud blanco y negro. Cada muestra presenta un punto blanco y negro. Cada punto tiene un contenido de decisión Ho = 1 bit. Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina run length coding. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes.
CODIFICACIÓN FUENTE PARA FAXIMIL A26 A9 A8 26 9 8 60 Blancas 1 2 4 Negras Codificación: L = 67 Blancas 11 o 11 64 1000 3 64 11o11 + 3 100000
CODIFICACIÓN FUENTE PARA FACSIMIL Otros modelos de fuente para la modificación de señales de f1x se muestran en la figura 12 junto con las entropías correspondiente por cada punto de imagen. Debido a que la entropía representa el limite inferior del índice de transmisión la figura permite una comparación entre los diferentes modelos fuentes. Puntos de línea Longitudes Palabras de código 3 2 12 1000 11 001000
CODIFICACIÓN FUENTE PARA FACSIMIL Palabras de código Longitudes Longitudes blancas Longitudes negras 0 1 001010101 000111 0000110111 010 2 3 0111 1000 11 10 ; : : 63 00110100 000001100111 64 128 11011 10010 0000001111 000011001000 192 ; 010111 000011001001 : 1728 010011011 0000001100101 TABLA DEL CÓDIGO DE HUFFMAN MODIFICADO
MODELOS DE CANAL Un modelo de canal describe las perturbaciones mediante procesos estocásticos. Con la ayuda de un modelo de canal se puede determinar la capacidad de canal. La capacidad de canal indica el máximo contenido de información trasferible por un canal. Modelo de canal también se puede utilizar para reducir la probabilidad de error de transmisión de valores cercanos a cero.
MODELOS DE CANAL 1.- Patrones de error en canales reales: En la figura Nº 1 muestran ejemplos de secuencia con errores de transmisión producidos por canales discretos binarios reales. Los errores se clasifican en : a.- Errores de un bit. b.- Errores de ráfaga. c.- Mezcla de errores de un bit y de Ráfaga.
MODELOS DE CANAL Error Figura 14 a.- secuencia de símbolos binarios con errores de un bit. Figura 15 b.- Secuencia de símbolos binarios con errores de un bit y de ráfaga.
MODELOS DE CANAL La operación + corresponde a la adicción modulo dos con la siguiente tabla: Ejemplos: 0+0 = 0 0+1 = 1 1+0 = 1 1+1 = 0 X = 000101101 Y = 010101001 E = 010000100
MODELOS DE CANAL El patrón de error contiene unos en las posiciones de los símbolos binarias donde ocurrieron errores de transmisión y cero en las otras posiciones. Error de ráfaga : Secuencia de elementos de códigos para la cual entran dos elementos de códigos erróneos consecutivos siempre existen menos de Y elementos de códigos correctos. En un error de ráfaga el ultimo elemento del código de la ráfaga y el primer elemento de código de la siguiente ráfaga se encuentran separados por al menos r elementos de código correcto.
MODELOS DE CANAL Longitud de error de ráfagas es el número de elementos de código contenidos en un error de ráfaga. Ejemplo de un patrón de error: 00000110011000100000 El patrón de error anterior contiene con r = 2 dos errores de ráfaga de longitud 2 y un error de un bit. Si r = 4, dicha secuencia contiene solamente un error de ráfaga de longitud r = 10. La definición anterior permite mediante la selección adecuada del valor de r.
CANAL DISCRETO SIN MEMORIA El modelo de canal discreto sin memoria permite describir la manera sencilla canales que generan errores de un bit estadísticamente independiente. Suponga que la entrada de un canal discreto sin memoria se excita con la secuencia de símbolos del alfabeto : A 1,A 2,...A K..A K. Sea b 1,b 2,...b 3,...b J el alfabeto de la secuencia de símbolos correspondiente a la salida del canal. Un canal discreto sin memoria se define mediante las probabilidades condicionales p(b J / A K ), que dan la probabilidad de que un símbolo Ak se transforme en un símbolo bj.
CANAL DISCRETO SIN MEMORIA Sea X = X 1,... Xn,...X N una secuencia de entrada, donde Xn representa un símbolo arbitrario del alfabeto A 1,...A K,...A K. Sea Y = Y 1,...Yn,...Y N la secuencia correspondiente a la salida, del canal, donde Yn representa un símbolo arbitrario del alfabeto b 1,...b 2,...b J,..b J. En el caso de un canal discreto sin memoria cada símbolo a la salida del canal, es estadísticamente dependiente del símbolo correspondiente a la entrada del canal. Para una secuencia de N símbolos se cumple : Pn ( y / x ) = N P(yn / Xn) N=1
CANAL SIMÉTRICO Y BINARIO ( C.S.B) P ( Y/X) = P(y 1,...Y N / X 1,...X N ) = P (E 1,...E N ) Ejemplo : P(001 / 011) = p(e 1 = 0,E 2 = 1, E 3 = 0) = (1- p). p.(1-p) = (1-p) 2 p.
CODIFICACION DE VIDEOS A VELOCIDADES MUY BAJAS (8...64 Kbps) USANDO MODELOS DE OBJETOS EN 2D ANTECEDENTES Un aspecto fundamental en los desarrollos de los sistemas multimedia, es el eficiente almacenamiento y la transmision de secuencias de imagenes. Adicionalmente, el funcionamiento basado en objetos está adquiriendo mayor importancia a medida que son requeridos con la aparición del mpeg 4. En un futuro, el promedio de datos entre 8 y 64 kbps facilitará la transmision a trave s de canales de telefonía móvil y fija como también sobre la internet. Objetivo:los algoritmos estandarizados como elitu-r rec., H261 y h263, se aplcan basados en el procedimiento de las imagenes de entrada. Solución: cada imagen es subdividida en objetos bidimensionales de forma fisica aleatoria de diferente movimiento y localizacion. Esto fisica aleatoria de diferentes movimiento y localizacion. Esto permite en primer lugar una mayor presicion de la descripción del mundo real y en segundo lugar el direccionmiento por separado de contenidode imagenes especificas.
Para cada objeto,son estimados los parámetros de forma, textura y movimiento bidimencional con respecto a la imagen previa. Muchos de los cambios entre imágenes sucesivas son descritas solamente por parámetros de forma y movimiento que pueden ser transmitidos de manera eficiente, solamente para áreas de imágenes donde esta descripción falla, los parámetros de textura son transmitidos. En el lado receptor, la imagen es sintetizada usando los parámetros transmitidos. Esta solución fue considerada durante el desarrollo del estándar MPEG-4 y fue incluida dentro del modelo de verificación de vídeo que adoptó el mismo principio de codificación.
ANALISIS / SINTESIS Codificación de Audio ( MPEG-4 HILN ) La cuantización y codificación de modelos paramétricos es controlada por un modelo físico que amplía la señal de entrada la cual depende de la sensibilidad del oído humano para la reconstrucción de errores. En el decodificador para cada objeto de audio, una señal es sintetizada desde el modelo paramétrico del decodificador. La salida del decodificador es la suma de todas las señales objetos.
La cuantización y codificación de modelos paramétricos es controlada por un modelo físico que amplía la señal de entrada la cual depende de la sensibilidad del oído humano para la reconstrucción de errores. En el decodificador para cada objeto de audio, una señal es sintetizada desde el modelo paramétrico del decodificador. La salida del decodificador es la suma de todas las señales objetos.
CODIFICACION DE VIDEO A BAJAS VELOCIDADES (8...64 Kbps) utilizando objetos trimensionales incluyendo modelos tridimensionales predefinidos (Modelos Faciales) Antecedentes: El estándar MPEG-4 hará posible la codificación de imágenes basados en contenidos, acceso a la imagen así como también la animación de modelos tridimensionales. Las velocidades propuestas de 8 hasta 64 Kbps, permiten la transmisión a través de canales de telefonía fija y móvil así como la red de INTERNET. Objetivo : El objetivo de este proyecto es incrementar la eficiencia de codificación utilizando la información del contenido de la escena y describiendo la geometría tridimensional del mundo real con modelos de objetos tridimensionales incluyendo modelos predefinidos.
Un modelo tridimensional puede incluir modelos predefinidos como por ejemplo modelos faciales para cabeza humana. Los modelos tridimensionales adecuados son seleccionados analizando el contenido de la imagen. Los parámetros para la textura, forma y movimiento del objeto y la iluminación de la escenas son estimados automáticamente. Muchos de los cambios entre dos imágenes sucesivas son descritas solamente por parámetros de forma, movimiento e iluminación que son codificados muy eficientemente. Solamente para áreas de la imagen donde esta descripción falla, los parámetros son de textura son transmitidos. En el lado receptor la imagen es sintetizada utilizando los parámetros transmitidos. Esta investigación es patrocinada por el gobierno Alemán
CODIFICACION DE VIDEO Para aplicaciones de muy baja velocidad ( de 8...64 kbps ) basados en modelos de objetos tridimensionales. Antecedentes : un punto fundamental en los sistemas multimedia actualmente desarrollados es el eficiente almacenamiento, transmisión y manipulación de secuencia de imágenes y escenas tridimensionales. Objetivo : Por cuanto los algoritmos de codificación como el ITU rec H261 H263 asi como el MPEG-4 para vídeo describe los cambios en la secuencias de imagen a través de movimientos bidimensionales paralelos al plano de la imagen, el objetivo de este proyecto es hacer uso de la geometría tridimensional del mundo real con movimientos bidimensionales paralelos al plano de la imagen. Solución : Para una codificación de imagen eficiente, los cambios que se producen desde una imagen a la siguiente, son descritas por modelos de objetos tridimensionales texturizados y por la rotación y traslación tridimensional.
Los objetos pueden ser articulados y la iluminación de escenas puede consistir en luz difusa y directa. Para cada objeto son estimados la textura, el movimiento tridimensional, forma tridimensional y parámetros específicos ( por ejemplo, parámetros de mímica para modelos faciales ). Para cada objeto son estimados la textura, el movimiento tridimensional, forma tridimensional y parámetros específicos ( por ejemplo, parámetros de mímica para modelos faciales ).
GRACIAS POR SU ATENCIÓN