Archivos de audio digital

Para ser procesados por las computadoras, los archivos de audio digital deben tener las siguientes características, independientemente del tipo de archivo:

a) Encabezado. Contiene el tipo de archivo, el número de canales (monoaural, estéreo, etcétera), la frecuencia de muestreo, la cuantificación y duración.

b) Datos. Los valores numéricos codificados del proceso de registro. ¿Qué tamaño en bytes puede ocupar un archivo de audio digital?. Es el resultado de multiplicar la frecuencia de muestreo por la duración en segundos, por el total de pistas o canales y por la cuantificación.

Eso nos da un resultado en bits. Al dividirlo entre 8 (cantidad de bits por byte) se tendrá el tamaño del archivo en bytes. Por ejemplo: un minuto de audio con frecuencia de muestreo de 44.1 Khz, 16 bits de cuantificación con dos canales (estéreo) tendrá un resultado en bytes de (44100 x 60 x 2 x 16) /8 = 10 584 000, poco más de 10 MB.

Lo anterior no considera ciertos formatos de compresión, que reducen la cantidad de bytes almacenados al establecer una relación entre las posiciones de los ceros y unos en el archivo. Los principales archivos de audio digital son:

CDA (Compact Disc Audio). Es el formato nativo de los discos compactos, con frecuencias de muestreo de 44.1 Khz, 16 bits de cuantificación y en dos canales.

Es claro que ocupa mucho espacio, por lo que un disco compacto promedio tiene capacidad de 74 minutos.

WAV (Microsoft Wave-from). Estándar en las computadoras con sistema Windows. A diferencia del CDA, posee más frecuencias de muestreo: desde los 8 Khz hasta 192 Khz. Se puede deducir que puede requerir más espacio en memoria, mayor capacidad de procesador y recursos de disco.

AIFF (Audio Interchange Format File). Popular en sistemas Apple. Soporta hasta 44.1 Khz y 32 bits de cuantificación.

RA o RM (Real Audio). Creado por Real Networks. A pesar de tener una muy buena compresión y descompresión, generalmente su calidad no es adecuada para aplicaciones profesionales, pero es muy usado en la distribución de señales de audio a través de Internet en tiempo real o en vivo, esto es, en modo de streaming.

Windows Media Audio (WMA o MS Audio). Creado por Microsoft para competir con el MP3.

MIDI (Musical Instrument Digital Interface). Más que un archivo, es un protocolo o norma para transferir información entre dispositivos musicales como sintetizadores, guitarras eléctricas, violines electrónicos y software diverso.

Un archivo o comunicación MIDI indica tonos, pulsos, variaciones de intensidad, sostenidos y duraciones, que pueden alterarse en cada instrumento. Es muy útil para los artistas que desean generar sus producciones combinando varios dispositivos con el apoyo de computadoras.

Mención aparte merece MP3 (MPEG-1 Capa 3). Fue creado por Thomson Multimedia y el Instituto Fraunhofer de acuerdo con la norma establecida por el Grupo de Expertos de Imágenes en Movimiento (MPEG) para ser el estándar de audio digital en los archivos de video MPEG-1.

A diferencia de los formatos anteriores, MP3 contiene procesos de alta compresión, y puede reducir el tamaño de los archivos hasta 12 veces.

¿Por qué es tan popular? Gracias al nivel de compresión de los archivos, es mucho más fácil distribuir audio digital a través de Internet. Transferir un archivo CDA promedio de cuatro minutos, implicaría poco más de tres horas de conexión a Internet por medio de un módem de 28.8 Kbps.

En cambio, el mismo archivo en MP3 con la compresión más alta, podría requerir de sólo 15 minutos para completar la descarga.

La compresión que hace MP3 de la información binaria se apoya en un concepto denominado codificación perceptiva, que elimina frecuencias en teoría no fáciles de captar por los humanos, conservando la fidelidad del sonido en la medida de lo posible y reorganizando las relaciones de registro de los ceros y unos en el archivo final.

Recientemente se introdujo MP3PRO, que comprime aún más la información, hasta la mitad de tamaño que ocupa un archivo MP3.

Por las dimensiones tan prácticas de los archivos MP3, muchos nuevos reproductores han surgido en el mercado, lo mismo lectores de disco compacto que interpretan archivos CDA y MP3, hasta pequeños dispositivos con memoria flash y PDAs, por lo que los usuarios pueden agregar archivos que obtengan de Internet, con la ayuda de un equipo de cómputo.

Existen multitud de programas para la captura de audio, desde la tarjeta de sonido de la computadora y su conversión digital a MP3. También hay rippers, o programas que permiten la extracción de audio digital de cierto formato, como el CDA, para convertirlo a WAV o MP3; y programas de postproducción, que permiten combinar archivos de diversos formatos, mezclarlos, alterar su niveles, crear efectos y producir archivos en uno u otro formato dependiendo del uso final.

Puede convertirse de un formato a otro siempre que se conserven la frecuencia de muestreo, los canales y la cuantificación. Es fácil deducir que si las frecuencias de muestreo y la cuantificación varían, habrá ocasiones en las que el “regreso” o codificación a un formato de alto nivel no será posible, por ejemplo: un archivo MP3 a 32 Kbps no poseerá información suficiente para crear a partir de él un archivo WAV o CDA de 115 Kbps.

Fuente: Apuntes de Animación Bidimensional de la U de Londres