ESTANDAR DE COMPRESION DE AUDIO ATRAC3plus Ing. Ivan Lobato Universidad Central de Venezuela E-mail: ivan_lobato@digitel.com.ve RESUMEN La revolución del audio digital portátil no hubiera sido posible sin la aparición de los códigos de audio, capaces de reducir de manera considerable el peso de los archivos sonoros. Los códigos han evolucionado con mejoras y nuevas características, creándose también compresores sustitutos capaces de ofrecer mejor calidad en menor espacio. Además, la aparición de los códigos sin pérdidas -concepto heredado de la expresión anglosajona "lossless"- ha supuesto un giro radical en la compresión de audio. Estos códigos "lossless" se desmarcan sustancialmente de esta filosofía, ya que su compresión es totalmente recuperable tras la descodificación. Esta forma de compresión implica una calidad idéntica a la de la fuente original, y supone un aumento necesario de procesado. El código ATRAC3plus propietario de multinacional japonesa Sony, nace como el sustituto de los anteriores códigos y junto con él están el propio instituto Fraunhofer (MP3) o el AAC PLUS V2. Palabras claves: Atrac, Lossless, Compresión de audio. ABSTRACT The revolution of digital portable audio had not been possible without the appearance of the audio codes, able to reduce in a considerable way the weight of the sound files. These codes have evolved with improvements and new characteristics, being also created compressors substitutes able to offer better quality in smaller space. Also, the appearance of the codes without losses - inherited concept of the expression "lossless" - it has supposed a radical turn in the compression of audio. These codes "lossless" differ substantially of this philosophy, because the compression is completely recoverable after the decoding. This compression form implies an identical quality of the original source, and it supposes a necessary increase of their processing. The code ATRAC3plus proprietary of Japanese multinational Sony born as the substitute of the previous codes and together him Fraunhofer (MP3) institute or AAC PLUS V2. Keywords: Atrac, Lossless, Audio Compression. INTRODUCCION A raíz de la evolución continua del audio digital muchas veces se habrán preguntado acerca de la compresión de la música y su almacenamiento en medio físico, tales como los discos compactos, disco duros, o sobre la adquisición de archivos de música comprimidos a través de la Internet. A continuación le echamos un vistazo a alguno de los sistemas de compresión utilizados en la actualidad y lo que ocurre realmente cuando comprimimos el audio. 1
LA COMPRESION DEL AUDIO Básicamente el proceso de compresión del audio se inicia con la digitalización, la cual se compone principalmente de dos fases: muestreo y cuantización. En el muestreo se divide el eje del tiempo en segmentos discretos: la frecuencia de muestreo será la inversa del tiempo que medie entre una medida y la siguiente. En estos momentos se realiza la cuantización, que, en su forma más sencilla, consiste simplemente en medir el valor de la señal en amplitud y guardarlo. El teorema de Nyquist garantiza que la frecuencia necesaria para muestrear una señal que tiene sus componentes más altas a una frecuencia dada f es como mínimo 2f. Por tanto, siendo el rango superior de la audición humana en torno a los 20 Khz, la frecuencia que garantiza un muestreo adecuado para cualquier sonido audible será de unos 40 Khz. Concretamente, para obtener sonido de alta calidad se utilizan frecuencias de 44'1 Khz, en el caso del CD, por ejemplo. Y otros valores típicos son submúltiplos de la primera, 22 y 11 Khz, utilizados en la radio FM. Figura 1. Ejemplo de compresión a 22 Khz. Cual de es esta información se puede descartar cuando comprimimos el audio? Básicamente, es posible descartar todos los sonidos que son inaudibles para los seres humanos. Las nuevas tecnologías de compresión de audio pueden reducir el tamaño de los datos eliminando los sonidos que no son captados por el humano, o, transformando estos en otros sonidos. 1. TECNOLOGIA ATRAC El sistema de compresión ATRAC (Adaptive Transform Acoustic Coding) se trata de un algoritmo de codificación que ofrece un radio de compresión de 1:4,83. Es decir, logra reducir la carga de datos a 1/5 de lo que necesitaría la señal original o de lo que requeriría un CD. El ATRAC utiliza una codificación porcentual que es un sistema de codificación con perdidas. La codificación porcentual se basa en las capacidades oído humano. Cuando recibimos una gran 2
cantidad de estímulos sonoros, nuestro oído sólo nos permite escuchar aquellos de mayor intensidad, el resto quedan enmascarados y no se oyen. Por el mismo motivo, el ATRAC elimina las frecuencias que el oído humano no es capaz de reconocer, quedándose sólo con las audiofrecuencias (20 a 20.000 Hz). El ATRAC divide la señal de entradas en tres bandas de frecuencia: 1. Inferior a 5,5 khz. 2. Entre 5,5 y 11 khz. 3. Más de 11 khz. Cada una de estas tres señales es analizada y filtrada independientemente, utilizando la transformada directa de coseno modificada (MDTC), lo que da lugar a subgrupos de entre 20 y 16 sub-bandas por cada una de las 3 bandas de frecuencia. ATRAC3 usa un algoritmo de compresión de datos que adapta su análisis dependiendo de la frecuencia que los componentes y las características del sonido original. Esto permite que dicho algoritmo realice una compresión de datos aproximadamente 1/10 en relación de su tamaño original con casi ninguna pérdida en la calidad de sonido. ATRAC3 realiza una compresión de alta eficiencia dividiendo la señal de audio en cuatro bandas y analizando las características de sonido de cada una de las bandas con extrema precisión. Al principio, debido a la alta tasa de compresión del ATRAC, éste no se utilizaba para operar con audio a nivel profesional. Con el tiempo, los codificadores ATRAC han mejorado considerablemente desde la primera generación, y actualmente, se dispone de versiones ATRAC que generan señales de audio que se escuchan idénticas a la fuente original. Además, comparado con otros algoritmos de compresión (por ejemplo, el MPEG layer 3 utilizado en los archivos MP3) ATRAC ofrece resultados de mayor calidad. 2. TECNOLOGIA ATRAC3 Figura 2. Sistema de compresión ATRAC3 2.1 Analiza las características de sonido en cuatro bandas. 3
2.2 Divide el sonido en dos tipos y comprime cada tipo eficientemente. Las señales que poseen sonidos puros, tales como las que son emitidas por un violín o un triángulo, cuando se analizan profundamente, se puede encontrar que estos están compuestos de distintos sonidos, los cuales tienen un nivel más alto en frecuencia. ATRAC3 clasifica y separa los datos de frecuencia de estas dos clases diferentes de sonidos, incrementando la eficiencia en la compresión. Figura 4. Reemplazo de patrones digitales 3. TECNOLOGIA ATRAC3plus ATRAC3plus representa un realce adicional del algoritmo de compresión ATRAC3, se centra principalmente en un nuevo algoritmo para el análisis de señal de sonido mucho más preciso. Esto permite que a la tecnología comprima los datos originales aproximadamente 1/20 de su tamaño original con casi ninguna pérdida de la calidad de sonido. 3.1 Analiza las características de sonido en dieciséis bandas. Figura 3. Análisis de frecuencia en ATRAC3 2.3 Reemplaza patrones digitales recurrentes con patrones digitales más breves. Las señales digitales son expresadas como ceros (0) y unos (1). ATRAC3 analiza estos patrones digitales de ceros (0) y unos (1) y reemplaza las combinaciones que se repiten frecuentemente con combinaciones más breves y aquellas que no ocurren a menudo con combinaciones más largas. Esta regla permite que al tamaño de datos del conjunto sea reducido notablemente. ATRAC3plus divide la señal en 16 subbandas, permitiendo un análisis mucho mas preciso. ATRAC3plus también usa una transformación más larga que el algoritmo ATRAC3 para la transformación de los datos, dando como resultado un análisis mas fino en frecuencia, este algoritmo permite analizar con más precisión los sonidos. 4
Figura 6. Reemplazo de patrones digitales. Figura 5. Sistema de compresión ATRAC3plus. 3.2 Incrementa la variedad de patrones digitales de reemplazo. ATRAC3plus reemplaza los patrones digitales de la señal tal y como lo hace ATRAC3, pero ampliando sus posibilidades de compresión, agregando mas patrones digitales, incrementando a su vez la rata de compresión. 4.TECNOLOGIA AVANZADA ATRAC LOSSLESS Advanced Lossless de ATRAC es una tecnología lossless de compresión de audio recientemente implementado para usuarios que exigen la calidad de CD. Esta nueva tecnología puede comprimir los datos de música de CD aproximadamente a la mitad de su tamaño original sin perder cualquier información, y brinda la reproducción exacta de calidad de CD. Advanced Lossless de ATRAC incluye datos tanto del algoritmo de ATRAC3 y datos de ATRAC3plus, esto quiere decir que no sólo usted puede disfrutar la reproducción de calidad de CD sobre su PC, pero ejecutando únicamente los datos ATRAC3 o los datos de ATRAC3plus, los archivos también pueden ser transferidos fácilmente y escuchado sobre equipos compatibles con dichos formatos. 5
4.1 Compresión escalable para combinar con el rendimiento del dispositivo de reproducción. Advanced Lossless de ATRAC incluye datos tanto del algoritmo de ATRAC3 y datos de ATRAC3plus, y la información residual que ATRAC3 o ATRAC3plus eliminaron. Esto quiere decir que el ATRAC3 o los datos de ATRAC3plus pueden ser extraídos justo como son, o la información eliminada puede ser añadida para reproducir la información sobre el CD original perfectamente. Esta técnica de compresión de datos, la cual le otorga la posibilidad al dispositivo de reproducción de escoger la manera para la reproducción de los datos de acuerdo con su capacidad, se denomina "Compresión escalable." datos, permitiendo que el tamaño de estos datos se quede sea menor. Figura 8. Compresión convencional. Figura 9. Compresión avanzada Lossless. CONCLUSIONES Figura 7. Advanced Lossless de ATRAC Cuando se requiera escuchar un track del CD con buena calidad en la PC y también escuchar dichos tracks sobre un reproductor de música portátil convencional, le obligan a que se cree y almacene ambos tipos de datos sobre su PC. Advanced Lossless de ATRAC, solamente requiere que usted guarde un tipo de datos sobre su PC, esto quiere decir que no se necesitan descomprimir los Debido a la gran cantidad de sistemas de compresión utilizados en el mercado tales como AACPLUS, MP3PRO, WMA, etc. y para no extendernos en la explicación de cada uno de estos sistemas, preferimos enfocarnos en uno de los sistemas con la mayor capacidad de compresión en relación con la calidad del audio, como lo es el ATRAC3plus propietario de la compañía SONY. Dicho formato de compresión, no se hace tan conocido como los nombrados anteriormente, ya que no es un formato libre, y solo lo pueden utilizar los equipos fabricados por la compañía SONY. El formato de audio ATRAC3plus mantiene la calidad original porque basa su compresión en la eliminación de los sonidos imperceptibles para el oído humano, a diferencia de otros sistemas, 6
que minimizan los sonidos bajos o agudos para alcanzar un alto nivel en la rata de compresión. Esta tecnología fue desarrollada por Sony y es utilizada en todos sus equipos digitales Walkman, Reproductores de carro, MiniDisc, y aquellos que leen los archivos ATRAC3plus así como otros formatos de audio. BIBLIOGRAFÍA http://www.sony.net/products/atrac3/te ch/index.html http://www.codingtechnologies.com/index. htm http://es.wikipedia.org/wiki/atrac MPEG-4 Audio Lossless Coding, T.Liebchen, Y.Reznik, T.Moriya, and D.Yang, 119th AES Convention, 2005. Tutorial on Perceptual Audio Coding Algorithms, Markus Erne, 2000 7