Tratamiento probabilístico de la Información. INGENIERÍA DE SISTEMAS Cursada 2017

Documentos relacionados
Métodos de compresión de datos

Teoría de la Información

Práctica 5. Códigos Huffman y Run-Length

Tema 8: ALMACENAMIENTO

Algoritmos glotones 2 (código de Huffman) mat-151

Compresión de imágenes

Compresión de Datos. Método de Huffman. Dpto. Informática

Procesamiento Digital de Imágenes

Universidad Simón Bolívar Departamento de Computación y Tecnología de la Información Organización del Computador CI-3815

INGENIERÍA DE SISTEMAS Cursada 2017

F. Javier Gil Chica 2010

Banda Ancha. Compresión, Almacenamiento y Transmisión Eficiente de Señales de Voz, Video y Datos. MSc. Luis Rojas

Tratamiento probabilístico de la Información. INGENIERÍA DE SISTEMAS Cursada 2016

Capítulo 8. Capa de Presentación 8.1 Representaciones comunes de los datos ASCII 7 bits ASCII 8 bits Unicode

Algo sobre Compresión de Datos

M É T O D O S D E C O M P R E S I O N Y D E S C O M P R E S I O N.

Almacenamiento de datos. CI-1010 Introducción a la computación Prof. Braulio José Solano Rojas ECCI, UCR

Análisis y Complejidad de Algoritmos. Arboles Binarios. Arturo Díaz Pérez

Podemos distinguir dos técnicas fundamentales. Ambas se utilizan en estándar MPEG-2.

ÁRBOLES CRISTIAN ALFREDO MUÑOZ ÁLVAREZ JUAN DAVID LONDOÑO CASTRO JUAN PABLO CHACÓN PEÑA EDUARDO GONZALES

Tema 9. Compresión de imágenes

Télématique ISSN: Universidad Privada Dr. Rafael Belloso Chacín. Venezuela

Códigos IRA. Máster en Multimedia y Comunicaciones Comunicaciones Digitales. Luca Martino

Proyecto: Comprimir, convertir y los. Tecnología de la comunicación II. codecs. Integrantes del grupo:

Notas sobre Compresión de Datos

Compresión de Datos Multimedia

Tarea 5: Estrategia voraz y Divide y

UNIDAD I.- INTRODUCCIÓN A LA GRAFICACIÓN POR COMPUTADORA

Sistemas de comunicación

Análisis de Señales Digitales

2 de mar de 2004 Codificación de imágenes y v ideo

Introducción a la Teoría de la Información

Introducción a Árboles Árboles Binarios

Operaciones a nivel bit

RESUMEN. Palabras Clave: Algoritmo de compresión, compresión sin pérdida, teoría de la información

COMUNICACIÓN DE DATOS

TEMA 2. CODIFICACIÓN DE LA INFORMACIÓN

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 15

Trabajo Práctico Nº 1: Abstracción

Implementación de un sistema inalámbrico de Audio, bajo un esquema de modulación QPSK/8PSK con una codificación convolucional

Estructura de datos y de la información Boletín de problemas - Tema 10

Almacenamiento de imágenes digitales. Primera parte

Digitalización y compresión de vídeo

EL SONIDO DIGITAL EDICIÓN DE AUDIO

Introducción a los fundamentos tecnológicos de la producción digital II

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA PROGRAMA DE ESTUDIO

2 TÉCNICAS DE COMPRESIÓN DE LA SEÑAL DE VÍDEO

Sistemas de compresión de la imagen (1ª parte)

Tema 7 Compresión de bioseñales

Colegio Diocesano San José de Carolinas

A veces queremos almacenar algún elemento que es Verdadero o Falso. Este tipo de dato se llama Booleano y su representación es sencilla, para cada

Aritmética del Computador

Universidad de Costa Rica Facultad de Ingeniería Escuela de Ingeniería Eléctrica

Análisis y Diseño de Algoritmos

Creación, edición y publicación de videos digitales

Tema 1. Informática Básica

Procesos Multimedia: Captura y Reproducción. Septiembre de 2016

Sobre Codificación Conjunta Fuente-Canal

Estructura de Datos Unidad 6: ARBOLES

Procesamiento Digital de Imágenes. Pablo Roncagliolo B. Nº 16

ESTRUCTURA DE DATOS. ABB Arboles de Búsqueda Binaria

Estructura de Datos. Estructuras de Datos no lineales : Árboles

El algoritmo de compresión de datos LZ78. Elvira Mayordomo junio 2003

Tema 1: INTRODUCCIÓN A LAS IMÁGENES DIGITALES

Manejo de Imágenes SINTAXIS IMÁGENES LINKEADAS

Evidencia 2 TIPOS Y FORMATOS DE ARCHIVOS. Fannia Irazú Araiza / FACULTAD DE CIENCIAS DE LA COMUNICACIÓN UNIVERSIDAD AUTÓNOMA DE NUEVO LÉON

Sistemas de Comunicaciones

CAPITULO 2 ETAPAS DE COMPRESIÓN DE IMAGENES. La transformada discreta del coseno (DCT) también denominada transformada del coseno

Tema 3. Compresión de la información de video. Contenidos

DCT(x[n]) C[u] α(u) x[n] cos (2n 1) π u 2N

Imagen = Histograma. Modificaciones del Histograma

Tema 3: PROCESAMIENTO EN EL DOMINIO DELA FRECUENCIA I N G E N I E R Í A I N F O R M Á T I C A

Estructuras de datos: Árboles binarios de

Unidad 2. La Información en los Ordenadores

Tema 3. Compresión de la información en televisión digital (formato MPEG-2) Contenidos

Técnicas de Compresión de Datos:

Compresión y restauración de imágenes por técnicas no lineales

Introducción a los códigos compresores

Árboles n-arios de búsqueda. Lección 16

Algoritmos genéticos

Universidad Católica Nuestra Señora de la Asunción

Teoría de la Información

Sistema de conocimientos Definición de sonido y video digital. Formatos de sonido Formatos de video Procesamiento digital de sonido y video.

12/08/2017 AVL. Especificación sobre árboles AVL. AVL: rotaciones

MATLAB y la teoría de la información

Árboles balanceados (AVL) Tablas de dispersión (Hash) Colas de prioridad (Heap)

4.1 Concepto de árbol.

Simulación y Análisis de Algoritmos de Compresión Empleados en un Sistema de Comunicaciones Digitales.

PCM MODULACION ANALOGA CON PORTADORA DIGITAL

Webir /09/2014

Estructuras de Datos II

El nivel Interno. Índice Tema 3

1. PRINCIPIOS BÁSICOS DE PROGRAMACIÓN

Que es 7zip? Es un compresor, análogo al Winrar, Winzip... pero con un mayor grado de compresión.

Algoritmos de Compresión de Imágenes

INSTITUTO NACIONAL SUPERIOR DEL PROFESORADO TÉCNICO - TÉCNICO SUPERIOR EN INFORMÁTICA APLICADA - PROGRAMACIÓN I

Transmisión de Datos Codificación de Fuente

P1 y P2 Modulador Bloque con modulacion ASK/FSK

Comunicación de datos

Codificación de audio MPEG. Álvaro Pardo

Transcripción:

TEORÍ DE L INFORMCIÓN Tratamiento probabilístico de la Información Compresión de datos INGENIERÍ DE SISTEMS Cursada 7 COMPRESIÓN DE DTOS Objetivo: Reducir la cantidad de datos para representar la información, eliminando (o reduciendo) la redundancia. Datos originales símbolos compresión código Canal de comunicación lmacenamiento Datos comprimidos Relación :, 4:, 5:... La compresión permite: - umentar la capacidad de almacenamiento de los dispositivos - Transmitir en menos tiempo información por el canal

lgunos ejemplos Texto Imágenes COMPRESIÓN Y REDUNDNCI CCCCC (,)(,8)(C,5) Video Original (. Mb) (8Kb) : COMPRESIÓN / DESCOMPRESIÓN datos originales Compresor datos comprimidos Descompr. datos decodificados canal de comunicación almacenamiento genera una representación compacta de los datos de entrada (mensaje de la fuente) reconstruye el mensaje original (o una aproximación) a partir de la representación comprimida

Sin Pérdida o reversibles (loosless compression) Mantienen la integridad de la información (los datos descomprimidos coinciden con los datos originales) Se aplica a texto, bases de datos, código fuente, imágenes críticas, Tasas de compresión moderadas: : (texto) 4: (imágenes) La longitud media del código está acotada por la entropía MÉTODOS DE COMPRESIÓN ( H L) Con Pérdida o irreversibles (lossy compression) No mantienen la integridad de la información (los datos descomprimidos son aproximación a los originales) Se plantean métodos aplicables a imágenes, video, sonido Tasas de compresión altas: : (imágenes) : (video) No tienen como límite la entropía (pérdida de información) ( L H) Original Descomprimida (8:) COMPRESIÓN : MODELO/CODIFICDOR Datos originales símbolos prob. usa modelo codificador act. código prob. usa modelo act. decodificador Canal lmacenamiento símbolos Datos descomprimidos Modelo: Se basa en las probabilidades de los símbolos de la fuente (sin memoria, con memoria, extensión a orden n) Codificador: Codifica los datos de entrada usando el modelo El codificador y el decodificador se basan en el mismo modelo El modelo puede ser: o Estático es fijo, es conocido por codificador y decodificador (universal) o Semi-estático es fijo, pero se construye a partir de los datos a comprimir o Dinámico o adaptativo el modelo se actualiza durante el proceso

MODELOS: CRCTERISTICS Métodos de compresión sin pérdida ( H L) Estadísticos (codifican un símbolo por vez) asados en diccionario (codifican secuencias de símbolos) Estáticos (no cambia modelo es universal) Semiestáticos (arma el modelo con los datos) daptativos (actualiza el modelo al leer cada dato) Estáticos (no cambia diccionario) Semiestáticos (arma diccionario con datos) daptativos (actualiza el diccionario al leer cada dato) Ej. Tabla pi si ci.5 / /.4 / / /4. /4 C Ej. Diccionario ci frases.. CD C.. MODELOS: CRCTERÍSTICS Estático (+) Requiere una única pasada por los datos para codificar ( -) La distribución de probabilidades (fija) puede diferir de los datos a codificar (+) No se debe transmitir/almacenar la distrib. de prob. al decodificador Semi-estático ( -) Requiere dos pasadas por los datos: una arma la tabla, y otra codifica (+) La distribución de probabilidades se ajusta a los datos a comprimir ( -) Se debe transmitir/almacenar la distrib. de prob. al decodificador Dinámico (+) Requiere una única pasada por los datos para codificar (+) La distribución de probabilidades se va ajustando a los datos al procesar (+) No se debe transmitir/almacenar la distrib. de prob. al decodificador ( -) lgoritmos más complejos, de mayor costo computacional 4

MÉTODOS DE COMPRESIÓN SIN PÉRDID Métodos estadísticos (codifican un símbolo por vez): o Shannon, Fano o Huffman estático y semiestático o Huffman dinámico (FGK) o Codificación aritmética asados en diccionario o sustitucionales: o lgoritmos LZ (codifican referencias a cadenas de símbolos previos): LZ77, LZ78 y sus variantes (pkzip, arj, winrar, compress,pdf, png) CON PÉRDID JPEG Run-Lenght c/pérdida Compresión Fractal VQ (Cuantificación vectorial) MPEG Run-Length (codifican secuencias de símbolos coincidentes) MEDIDS DE PERFORMNCE Tasa de compresión Relación del tamaño de los datos originales (t O ) vs. tamaño de los datos comprimidos (t C ) Se expresa generalmente como N : donde N= t O / t C Ejemplo archivo original: Mb - archivo comprimido: Mb compresión 5: (reducción 8%) Tiempo de compresión/descompresión Los algoritmos pueden ser simétricos o asimétricos (dependiendo si involucran igual costo computacional o no) Calidad error o pérdida de calidad entre datos originales y reconstruidos (para los métodos irreversibles) Ej: error medio (absoluto o cuadrático) y otras medidas derivadas 5

Simb. Prob. LGORITMO de HUFFMN David Huffman (95) C D.4... Ejemplo.4.6..4. In: DDC Out: Código C D IMPORTNTE: Para que la compresión sea efectiva se debe hacer un procesamiento de los sucesivos códigos a nivel bit LGORITMO de HUFFMN Genera un código óptimo (mínima longitud media <L>) para el conjunto de símbolos de una fuente S Para fuentes especiales, con probabilidades ~/ a, <L> ~ H(S) No suele alcanzar el límite H(S) porque no considera bits fraccionales (necesita al menos un bit para codificar un símbolo) Ejemplo: S= {s, s} con prob. {.99,.} H(S),8 pero el código asignará bit a cada símbolo Si H(S) es grande, la diferencia fraccional <L> - H(S) es despreciable, pero si H(S) es pequeña la diferencia puede ser considerable Para la extensión de orden m se cumple que: H(S) <L m >/m < H(S) +/m La performance del código mejora a expensas de un aumento exponencial del tamaño de la tabla de códigos Forma parte de la especificación de formatos y estándares de compresión (JPEG, MP, MPEG, GZIP, ) 6

HUFFMN DINÁMICO LGORITMO FGK Faller(97), Gallager(978), Knuth(985) El árbol de código inicialmente está vacío y se construye dinámicamente a medida que se procesa el mensaje cada nodo del árbol se le asocia un símbolo y un peso (frecuencia) Nodo especial nodo - asociado al punto de inserción Para que sea un árbol de Huffman debe cumplir siempre la propiedad de sibling: si se recorren los nodos de abajo hacia arriba y de izquierda a derecha, los pesos de los nodos deben aparecen en orden no decreciente no verifican sibling HUFFMN DINÁMICO LGORITMO FGK Faller(97), Gallager(978), Knuth(985) lgoritmo: ) Leer el próximo símbolo del mensaje ) Generar el código: si el símbolo está en el árbol emitir el código binario asociado a este símbolo si no está emitir el código del nodo seguido del símbolo literal nuevo (para el primer símbolo del mensaje no hay código para el nodo ) ) ctualizar el árbol: Si el símbolo está en el árbol incrementar la frecuencia del nodo y de los nodos en los niveles superiores acordemente Si no está dividir el nodo en dos: a la izquierda se deja el nodo y a la derecha se inserta el nuevo símbolo con frecuencia 4) Verificar la propiedad de sibling : Si no se cumple reestructurar el árbol, intercambiando los nodos en conflicto (con sus subárboles si los tuvieran): - el nodo de peso mayor y más próximo al inicio del recorrido - con el nodo de peso menor y más cercano a la raíz 5) Si no terminó el mensaje volver al paso ) 7

HUFFMN DINÁMICO LGORITMO FGK In: Out: In: Out: In: Out: Lista No verifica la propiedad de sibling: Intercambiar el de peso mayor y más cercano al inicio del recorrido con el de peso menor más cercano a la raíz HUFFMN DINÁMICO LGORITMO FGK El decodificador recibe la salida del codificador, construye el árbol y decodifica siguiendo los mismos pasos que realizó el codificador In: Out: In: Out: In: Out: No verifica la propiedad de sibling (intercambiar nodos) 8