Todo lo que deberías saber sobre los formatos de audio: lossy, lossless, WAV, MP3, AC3, AAC, OGG, WMA, MPC, FLAC, OPUS, MIDI, MOD... Aprende a diferenciarlos y convertir entre formatos.

¡Ojo! Hago directos en Twitch sobre desarrollo web, ¿Te apuntas? ManzDev

software
60

Escrito por

A lo largo de los años, han aparecido multitud de formatos de audio diferentes, con ciertas características y propiedades específicas de cada uno. Todo el mundo conoce el formato MP3, el códec de audio más extendido, pero no es, ni mucho menos, el único.

Formatos de audio: MP3, WAV, OGG, AC3, WMA, OGG, ACC, MPC, FLAC...
Formatos de audio: MP3, WAV, OGG, AC3, WMA, OGG, ACC, MPC, FLAC...

En este artículo, y tras la buena aceptación de su artículo hermano Formatos de video: Todo lo que hay que saber, explicaremos brevemente el origen, uso y características de los formatos (códecs) de audio más utilizados en la actualidad, complementando así la parte de audio en lo que se refiere al artículo anterior.

Formato WAV (Microsoft, 1991)

Formato WAV (Audio original, sin comprimir)
Formato WAV (Audio original, sin comprimir)

En primer lugar vamos a hablar del formato WAV, que aunque es un formato de audio, es diferente al resto de formatos de los que hablaremos puesto que este es realmente un contenedor, que puede tener en su interior información comprimida o no. No obstante, se suele entender por WAV, el formato con los datos sin comprimir.

Los archivos WAV son los equivalente al formato RAW de la fotografía, lo que se denomina un formato «crudo». En este caso, se trata de un formato de Microsoft que recoge el audio de una forma muy aproximada y exacta al sonido real.

El formato WAV se caracteriza en que ocupa gran cantidad de espacio en disco (dependiendo de su duración, 5min = 50MB aproximadamente), lo que lo hace poco práctico para almacenar en disco, y mucho menos en dispositivos o reproductores portátiles donde el espacio es limitado.

Su ventaja es que la calidad de audio es muy fiel al original capturado, y que al ser un formato sin compresión, pueden realizarse operaciones de edición de forma muy rápida. La mayoría de programas de edición de sonido trabajan en este «formato crudo» (o alguno similar) de forma temporal, pasándolo a un formato comprimido sólo al guardarlo a disco.

Lossy vs Lossless

Ahora, y antes de continuar, hay que diferenciar entre dos tipos principales de formatos (que también ocurre en los formatos de imágenes, por ejemplo). Estos dos tipos son los denominados Lossy (formato de compresión con pérdidas) y Lossless (formato de compresión sin pérdidas).

Compresión de audio: Formatos con pérdidas (lossy) y sin pérdidas (lossless)
Compresión de audio: Formatos de compresión con pérdidas (lossy) y sin pérdidas (lossless)
  • Lossy (formato de audio con pérdidas): Es aquel formato que, a partir de un audio original, elimina toda la información irrelevante (sonido imperceptible por el oído humano, por ejemplo) y lo convierte en una aproximación bastante fiel a la original. Por eso se denomina un «formato con pérdidas». Su mayor ventaja: El tamaño del fichero es considerablemente más pequeño (depende de la calidad establecida al realizar la compresión). Su mayor inconveniente: Algunas personas son capaces de notar la reducción de calidad.

  • Lossless (formato de audio sin pérdidas): Por otra parte, los formatos lossless son un tipo de formato comprimido mediante el cual es posible recomponer y obtener exactamente el audio original sin ningún tipo de pérdida de información (cosa que no es posible con el anterior). Su mayor ventaja: La calidad de audio, es mucho más fiel. Su mayor inconveniente: El tamaño del fichero, que aunque es menor que el audio original, sigue siendo bastante superior a los formatos lossy.

Formatos lossy (con pérdidas)

Formato MP3 (Fraunhofer Institute, 1993)

Formato MP3 (MPEG-1 Audio Layer III
Formato MP3 (MPEG-1 Audio Layer III

El formato de audio más popular y que todos conocemos es el MP3. Al contrario de lo que muchos creen, MP3 no es MPEG-3, sino MPEG-1 Layer 3. Antes de llegar esta versión, se pasó por otros dos formatos: MPEG-1 Layer 1 (MP1) y MPEG-1 Layer 2 (MP2), ambos surgieron también en 1993 y evolucionaron muy rápidamente. MP3 fue el que obtuvo gran popularidad debido a su gran calidad de sonido, versatilidad, bajo tamaño debido a su compressión lossy (5min = 5MB, dependiendo de la calidad), y su rapidez de compresión/descompresión.

Hoy en día es soportado por prácticamente cualquier software relacionado con el audio, reproductor de música portátil o sistema relacionado con audio.

Los MP3 (así como otros formatos de audio) tienen varias características adicionales. Por ejemplo, dos de ellas:

  • El bitrate (tasa de bits): Es la calidad del MP3, un número que puede ir de 32kbps (calidad mínima, tamaño menor) a 320kbps (calidad máxima, tamaño mayor). Actualmente, se utilizan valores alrededor de 192kbps (o superiores) para garantizar una calidad aceptable.

  • El método de compresión: CBR, que define que todo el audio se comprime de forma constante, al mismo bitrate, o VBR, que define que el audio se comprime de forma variable, reduciendo el bitrate en los instantes en los que no es necesario tener bitrate alto.

Para los usuarios de Windows, en SourceForge tienen MP3ext una actualización para Windows 7 (incluido 64 bits) de este clásico programa que reemplaza los iconos de los MP3 por un icono con su bitrate.

Además, los archivos MP3 también permiten guardar metadatos ID3, que no es más que la posibilidad de guardar en el archivo de audio información relacionada: nombre de la canción, artista, género, descripción, carátula del disco, año, etc... Un buen programa para gestionar esto es MP3tag.

Aparecieron otros formatos derivados como Mp3Pro o MP3 Surround, pero nunca llegaron a extenderse tanto como el MP3 original.

Formato AC3 (Dolby Laboratories, 1993)

Formato AC-3 (Dolby Digital)
Formato AC-3 (Dolby Digital)

Una de las principales limitaciones de los MP3 eran los canales de audio, donde podías tener 1 canal (mono) ó 2 canales (estéreo).

Sin embargo, por aquel entonces el surround o sonido envolvente comenzaba a ponerse de moda, y el formato MP3 original no lo soportaba. Ahí entró en escena el formato AC-3, también llamado Dolby Digital que soportaba desde un solo canal (audio mono), dos canales (audio stereo), cuatro canales (audio cuadrafónico) y hasta canales 5.1 (audio surround).

Empezó a utilizarse (y hacerse popular) por su uso en los canales de audio de videos y películas que necesitaban 5.1 para el sonido envolvente. Posteriormente, otros formatos derivados comenzaron a soportar más canales, como Dolby Digital Plus (hasta 7.1) o Dolby TrueHD (hasta 8).

URL | AC3Filter

Formato WMA (Microsoft, 1999)

Formato WMA (Windows Media Audio)
Formato WMA (Windows Media Audio)

En el año 1999, Microsoft se subía al carro con el formato WMA (Windows Media Audio) que básicamente era la alternativa al MP3 de Microsoft, muy similar aunque mejorándolo en algunos aspectos. Poco más tarde, surgieron varios perfiles diferentes dentro de WMA:

  • WMA Pro: Soporte para múltiples canales (como AC-3) y mejorando sustancialmente su calidad de audio.

  • WMA Lossless: Un formato de compresión basado en compresión sin pérdidas, al contrario del resto de WMA, que es un formato de compresión con pérdidas (lossy).

  • WMA Voice: Por último, un formato más orientado a la grabación de audio para voz (speech), para utilizar en conversaciones de voz como las que usan Skype, WhatsApp u otros.

Una de las características más controvertidas del formato WMA es que introdujo soporte opcional para DRM (derechos de autor), lo que permite proteger audio con licencias y derechos de autor.

URL | Windows Media

Formato AAC (Bell/Fraunhofer/Dolby/Sony/Nokia, 1997)

Formato AAC (Advanced Audio Coding)
Formato AAC (Advanced Audio Coding)

Otro formato que se utiliza muy frecuentemente, pero ha pasado relativamente desapercibido es el formato AAC, originalmente diseñado para ser el sucesor de MP3. Por este nombre, probablemente muchos no lo conocerán, pero es el formato de audio que utiliza Apple (muy probablemente porque al igual que WMA, soporta DRM) en iTunes o sus dispositivos, el famoso .M4A o el que se empezó a utilizar más adelante en los archivos de video de dispositivos móviles: .3GP.

Tiene varios tipos de perfiles, entre los que se encuentra AAC-LC (baja complejidad), HE-AAC (alta calidad) y HE-AACv2 (alta calidad mejorada).

URL | Formato AAC

Formato OGG (Xiph.org, 2000)

Formato Vorbis (OGG Vorbis)
Formato Vorbis (OGG Vorbis)

Con la llegada del año 2000, llegó un formato que acabó proclamado como el formato libre del MP3: OGG Vorbis. Aunque este formato empezó con extensión de archivo .OGG, con el tiempo también empezaron a usarlo para video (Theora), por lo que también es posible ver las extensiones .OGA (OGG Audio) y .OGV o .OGM (OGG Video/Movie), usándose OGG sólo para audio.

A parte de utilizarse como archivo de audio independiente, también se suele incorporar en archivos de video de formato Matroska o WebM para sus canales de audio.

Actualmente se utiliza en multitud de juegos, software o sistemas, por ser un formato mejor que el MP3 y equivalente a otros como AAC, pero sin los problemas de patentes o licencias.

URL | Vorbis

Formato RA (RealNetworks, 1995)

Formato RA (Real Audio)
Formato RA (Real Audio)

Aunque hoy en día está prácticamente en desuso, merece mencionarlo por su trayectoria en el pasado. RealNetworks sacó su formato cerca de 1995, junto a su (personalmente, traumático) reproductor Real Player. Fue uno de los primeros formatos que permitían hacer streaming (retransmisiones en vivo) tanto de audio como de video, aunque por aquella época las calidades de los mismos eran bastante pobres.

Hubo una época de transición tras 1997 en el que RealNetworks comenzó a integrar audio y video dentro de una misma extensión: .RM, pero poco después dió marcha atrás y volvió a adoptar las extensiones por separado.

URL | Real Networks

Formato MPC (Andree Buschmann/Frank Klemm, 1997)

Formato MPC (MusePack)
Formato MPC (MusePack)

Originalmente llamado MPEG+, MusePack (MPC ó MP+) es un formato lossy que partió del códec de MP2, pero que fue incluyendo mejoras variadas y combinando características similares de otros formatos, como AAC, MP3 o APE.

Aunque el formato es bastante interesante y muchos programas lo soportan, no ha conseguido hacerse hueco en el mundo del audio. Utiliza licencia LGPL y BSD.

URL | MusePack

Formato Opus (Xiph.org, 2012)

Formato Opus (Opus Interactive)
Formato Opus (Opus Interactive)

Opus es un nuevo formato de audio lossy, con la particularidad de que dicho formato puede utilizarse tanto para compresión de audio tradicional como compresión de audio orientada a voz, que tiene unas características ligeramente diferentes: no se requiere tanta calidad de audio (pero si un tamaño reducido) y debe ser muy rápido, ya que se busca utilizar en operaciones de tiempo real, como VoIP para llamadas de voz.

Estamos por lo tanto, ante un formato que puede utilizarse para múltiples tareas, adaptándose a cada una de ellas a la perfección. Opus reemplazó al antiguo codec Speex, otro códec de audio orientado a voz, también de la fundación Xiph.org.

URL | Opus Codec

Formato AMR (3GPP, 1999)

Formato AMR (Adaptative MultiRate Audio Codec)
Formato AMR (Adaptative MultiRate Audio Codec)

Y ya que nos hemos metido en el tema de voz, merece también nombrar el formato AMR, que comenzó a utilizarse de forma masiva en los teléfonos móviles, sobre todo antes de dar el salto a los smartphones, cuando el espacio en dispositivos móviles era bastante limitado y se quería dotar de grabación de audio a estos dispositivos.

Las mencionadas grabaciones de voz eran guardadas en formato AMR (audio), mientras que los videos eran guardados en formato 3GP (video), el cuál guardaba el audio del video en formato AMR.

Con el tiempo, 3GP fue evolucionando, y pasó de utilizar AMR para audio a empezar a utilizar AAC, que los dotaba de mejor calidad y resultados.

URL | Formato AMR

Formatos lossless (sin pérdidas)

Formato FLAC (Xiph.org, 2001)

Formato FLAC (Free Lossless Audio Codec)
Formato FLAC (Free Lossless Audio Codec)

Dentro de los formatos de audio sin pérdida de compresión, uno bastante popular es el formato abierto FLAC. Como mencionamos anteriormente, este tipo de formatos lossless comprimen la información de modo que es posible revertir esa compresión y volver a su estado original, funcionando de una forma similar a los formatos de compresión como ZIP (optimizada para audio), pero sin la necesidad de tener que descomprimirlo para escucharlo.

URL | FLAC

Formato APE (Matthew Ashland, 2000)

Formato APE (Monkey's Audio)
Formato APE (Monkey's Audio)

Antes de lanzarse FLAC, existía otro formato llamado APE, que funcionaba de la misma forma, realizando una compresión sin pérdidas del contenido de audio. Está mucho menos extendido y no ofrece un soporte completo para todas las plataformas, pero es otra alternativa a tener en cuenta, ya que da muy buenos resultados en compresiones sin pérdidas.

URL | Monkeys Audio

Formato WV (David Bryant, 2004)

Formato WV (WavPack)
Formato WV (WavPack)

Quizás con un nombre más acertado que los anteriores, WavPack (WAV empaquetado) es también un formato de compresión sin pérdidas, que permite reducir el tamaño de un archivo WAV entre un 30% y un 70%, sin perder calidad.

A diferencia de otros formatos, WavPack ofrece un modo híbrido en el que genera dos archivos: un .WV (lossy) similar a un MP3, y otro formato .WVC (lossless), que unido al primero, pueden restaurar el archivo original, por lo que tenemos un formato lossy que a la vez es lossless.

URL | WavPack

Otros formatos

No me gustaría terminar este artículo sin mencionar dos formatos que se salen un poco de las categorías anteriores, ya que son previos a la revolución de los formatos de compresión de audio digital.

Formato MIDI (MMA, 1983)

Formato MIDI (Musical Instrument Digital Interface)
Formato MIDI (Musical Instrument Digital Interface)

El primero de ellos es el formato MIDI, que seguía un planteamiento totalmente diferente a los vistos hasta ahora. En aquellos años era impensable guardar el audio digital de canciones, ya que no existían métodos de compresión tan eficientes y la escasez de espacio en disco era un punto importante a considerar.

Así pues, los ficheros MIDI son algo así como una partitura: un formato que guarda las notas de cada instrumento de la canción (pudiendo reproducir hasta 16 canales a la misma vez). En cada canal se colocan las notas de un instrumento concreto (de los 128 instrumentos MIDI existentes). El sonido de estos instrumentos no se guarda en el propio archivo, sino que están realmente almacenados en el sistema operativo (o en el software de la tarjeta de sonido). De esta forma se consigue que los formatos MIDI estén entre los 4KB y los 200KB aproximadamente.

Aunque algo olvidados hoy en día (debido a los avances del audio digital), los archivos MIDI aún son utilizados en la actualidad en el sector del ocio, como por ejemplo en SCUMMVM, un emulador de aventuras gráficas clásicas donde puedes cargar bancos de sonido personalizados para mejorar la música de dichos juegos: Ejemplo de audio mejorado con Beneath a Steel Sky. En el artículo de SCUMMVM tienes más ejemplos.

URL | General MIDI

Formato MOD (Karsten Obarski, 1987)

Formato MOD (Module Tracker)
Formato MOD (Module Tracker)

Por último, el formato MOD venía a dar una vuelta de tuerca a la idea del famoso formato MIDI, eliminando la limitación de tener que utilizar uno de esos 128 instrumentos. Con el formato MOD se guardaba el sonido del instrumento (sample) en pequeños archivos WAV dentro del propio archivo MOD. De esta forma se podían personalizar los instrumentos a utilizar y dotaba al formato de inmensas posibilidades.

Trackers musicales
Trackers musicales

Con estos formatos, componer música por ordenador se convirtió en una fiebre en la década de los 90, en las que se utilizaban los llamados trackers (programas para componer módulos de música) que a medida que fueron evolucionando, también lo hacían los formatos: MOD, XM (FastTracker II), S3M (Scream Tracker III) e IT (Impulse Tracker), fueron los más populares.

URL | Programas para componer módulos de música por ordenador

Descargar conversor entre formatos

Ahora, si lo que buscas es un programa para convertir entre diferentes formatos de audio o video, te puedo proponer varios, dependiendo de tu perfil de usuario:

  • Para los usuarios más avanzados, recomiendo utilizar ffmpeg, un potentísimo programa que permite convertir prácticamente cualquier tipo de formatos desde una línea de comandos:
Proyecto FFMPEG, el conversor más potente entre formatos
Proyecto FFMPEG, el conversor más potente entre formatos
  • A los usuarios que no les gustan las terminales de línea de comandos, pueden utilizar Audio video to exe, un sencillísimo programa que permite convertir entre formatos de una forma muy simple, e incluso una curiosa función para generar archivos ejecutables que reproduzcan audio.

  • Finalmente, si realizas a menudo la tarea de convertir entre formatos de audio o video, y abrir un programa e ir seleccionando opciones es algo que te da mucha pereza, puedes utilizar Video (and audio) converter scripts, una colección de simples scripts preparados para arrastrar el archivo de audio o video sobre el conversor deseado y realizar la conversión así de fácil:

Video (and audio) converter scripts
Video (and audio) converter scripts

Recuerda que también tienes el artículo complementario Formatos de video: Todo lo que hay que saber, donde repasamos los formatos de video: MP4, AVI (DivX, XviD), WebM, MKV, OGG, etc...

RELACIONADOS HTML5 Cheatsheet (Chuleta HTML) RELACIONADOS Formatos de video: Todo lo que deberías saber RELACIONADOS Animar personajes con animaciones CSS
x HTML5 Cheatsheet (Chuleta HTML)
Manz

60 comentarios

1 2

Sudbury Contractors
55

Let the pro handle your roofing needs in Sudbury. Roofing for Sudbury provides quality service at the most affordable rates. Contact us at 705-300-6438 for more.

Rafael
60

Muy bueno el artículo. A día de hoy, yo no tengo dudas en codificar en formato "opus", porque le da mil vueltas a los demás y si encima aplicas perfiles de audio (voz, música, diálogo, etc) optimiza mucho más aún el tamaño final del fichero. Uso "frea:ac" que es una herramienta libre para la codificación. Por cierto, la extensión adecuada (según la propia web de Xiph.org) es ".opus", aunque puedas incluir un audio ".opus" en un contenedor ".oga". como explican ellos en la definición del mimetype: .oga - audio/ogg Ogg Audio Profile (audio in Ogg container) Applications supporting .oga, .ogv SHOULD support decoding from muxed Ogg streams Covers Ogg FLAC, Ghost, and OggPCM Although they share the same MIME type, Vorbis, Opus and Speex use different file extensions. SHOULD contain a Skeleton logical bitstream. Vorbis and Speex may use .oga, but it is not the prefered method of distributing these files because of backwards-compatibility issues.

1 2

Publica tu opinión