Dicas

Áudio Digital – História e Curiosidades

AAC, M4A, MP3, WAV, WMA… Essas são algumas extensões de arquivos que você provavelmente já ouviu falar ou até mesmo conhece mais a fundo.

O áudio digital é a realidade de quase todo usuário de computador. Pela popularização imensurável do MP3 na última década, é comum considerarmos a extensão como a representação de um arquivo de áudio. Mas o fato é que o MP3 é apenas uma maneira de criar arquivos de músicas.

Todas as extensões mencionadas atestam o avanço e a popularidade da digitalização do som. Neste artigo, você vai aprender as diferenças entre eles e talvez descobrir que o MP3 não é o formato adequado às suas necessidades.

Antes dos formatos, o PCM

Essa é a sigla para Pulse Code Modulation (Modulação por Código de Pulsos), e esta é a tecnologia mais antiga de digitalização sonora. A história do PCM começa na década de 30, como uma maneira de representar sinais analógicos de maneira digital, ou seja, com suas ondas representadas em intervalos regulares.

Da mesma maneira que um vídeo é de fato uma sequência de imagens fixas, a amplitude, ou seja, a extensão de uma onda sonora digitalizada não é constante. A digitalização sonora envolve basicamente dois parâmetros: taxa de amostra (sample rate) e profundidade de bit (bit depth). O primeiro indica a quantidade de vezes em que a amplitude de uma onda é medida, enquanto o segundo indica o número de bits em cada amostragem. A variação desses parâmetros indica a fidelidade do áudio à gravação.

O PCM originou as diferentes maneiras de digitalização de áudio. Sony e Philips, na década de 70, desenvolveram a tecnologia e criaram o CD, que tem 44100 amostras por segundo (44.1 KHz) e amplitude de 16 bits. Já o PCM com 8 KHz de amostragem e 8 bits de resolução é utilizado no sistema telefônico.

Formatos não comprimidos e comprimidos

Formatos digitais de áudio se dividem basicamente em dois grupos: não comprimidos e comprimidos. Os primeiros garantem qualidade máxima, pois não modificam nenhum bit do original. Em contrapartida, exigem espaço. Um CD de áudio utiliza o formato CDDA (Compact Disc Digital Audio) e suporta 80 minutos de música, por exemplo. WAV e AIFF são exemplos de não comprimidos.

Já os formatos comprimidos, como o nome sugere, comprimem dados com o intuito de diminuir seu tamanho. Formatos como APE, FLAC e M4A são conhecidos como lossless e capazes de comprimir áudio sem perder qualidade.

Outros formatos comprimem ainda mais os arquivos, ganhando muito espaço. No entanto, eles já utilizam o princípio de abrir mão da qualidade absoluta para ganhar mais espaço e comodidade. Uma maneira de conseguir isso é remover faixas de áudio “teoricamente” imperceptíveis pelo ouvido humano. Há perda de qualidade, mas muitas vezes ela é realmente imperceptível. Por isso, formatos comprimidos são mais populares para o usuário comum. Um exemplo é o MP3.

WAV e AIFF, grandes e com qualidade

WAV e AIFF são dois bons exemplos de formatos não comprimidos que utilizam o método PCM.

WAV (o nome nasceu da palavra “wave”, que significa “onda“) é a sigla para Waveform Audio File Format, e foi desenvolvido pela Microsoft e IBM para armazenamento de áudio em PCs. É baseado em PCM e não “sacrifica” dados, portanto exige bastante espaço. Em média, ocupa até 10 MB por minuto. É compatível com praticamente qualquer tocador atual. Pela qualidade máxima, é indicado para edições, mixagens e trabalhos profissionais.

Como limitação, arquivos nesse formato não podem ter mais que 4 GB. As extensões comuns são WAV e WAVE.

Já AIFF é a sigla para Audio Interchangeable File Format, e pode-se dizer que é para a Apple (que o desenvolveu baseada em uma tecnologia da Electronic Arts) o que WAV é para a Microsoft. Também baseado em PCM, é um formato não comprimido, portanto de qualidade, mas que demanda espaço. A extensão comum é AIFF ou AIF, mas a lista de tocadores compatíveis é um pouco menor que o formato WAV.

Compressão sem perder qualidade

Há formatos que conseguem comprimir dados sem sacrificar qualidade, caso do M4AAPE e FLAC. Eles são conhecidos como “lossless” ou sem perda, em tradução livre. Esses formatos são como uma ponte entre qualidade e comodismo, pois são capazes de manter a qualidade original e inalterada em menos espaço do que WAV ou AIFF.

FLAC

É a sigla para Free Lossless Audio Codec, criado em 2003. Como afirmam os desenvolvedores, é como se fosse um ZIP, porém feito especificamente para áudio e com a vantagem de poder ser executado em vários players. Ele também é baseado em PCM, e os dados têm uma espécie de assinatura que permitem a conferência da integridade do arquivo.

Ao contrário de codecs com perda tais como o MP3 e o Vorbis, ele não remove nenhuma informação do fluxo de áudio, mantendo a qualidade do som, podendo comprimir um arquivo de CD em até 50%, inferior aos até 80% do seu maior concorrente MP3, em razão da total fidelidade ao arquivo original.

Uma vantagem do formato é o cue sheet, ou seja, um arquivo com todas as referências para a divisão de faixas de um álbum. Por exemplo, é possível ripar um CD em um único arquivo, e utilizar o cue sheet para dividir as faixas. O player ou gravador, neste caso, precisa ser compatível com a extensão CUE.

A velocidade de codificação nesse formato é rápida e exige menos processamento em comparação com outros codecs. Ele não é proprietário e pode ser usado livremente. A popularidade do formato cresce com o aumento da velocidade da conexão com a internet.

Arquivos FLAC ultrapassam a marca dos 1000 kbps, atestando a qualidade de áudio.

Extensão do arquivo: .flac

APE

Esta é a extensão do Monkey Lossless Audio File, outra maneira de comprimir áudio sem perder qualidade, que também se descreve como um ZIP para músicas. Tem código aberto disponível, e conta com sistema de detecção de erros e sistema próprio de tags.

Em comparação com FLAC, apresenta melhores índices de compressão, porém requer mais recursos de processamento, de acordo com resultados de benchmarks.

O formato Monkey’s Audio possui a terceira melhor taxa de compressão entre os formatos de áudio lossless, perdendo apenas para os formatos Lossless Audio e OptimFROG. O formato Monkey’s Audio é vantajoso em relação ao FLAC quando comparada a taxa de compressão, porém o formato FLAC possui suporte para multicanais de áudio, stream e Replay Gain, além de ser mais rápido na codificação e decodificação.

Possui 5 níveis de compressão, que são:

– Fast (-c1000): Processo de codificação bem rápido, no que resulta em um arquivo maior (menos compactado).
– Normal (-c2000): Processo de codificação normal. Resulta um arquivo menor que no modo Fast.
– High (-c3000): Resulta em uma boa compressão, porém a velocidade de codificação é menor em relação aos modos Fast e Normal.
– Extra High (-4000): Nível de compressão mais usado entre compartilhadores de arquivos APE. Realiza uma excelente compressão.
– Insane (-c5000): Melhor nível de compressão, porém o arquivo demora até 3 segundos para abrir quando executado, tem uma velocidade de codificação e decodificação baixa e é incompatível com alguns players portáteis que reproduzem arquivos APE.

Extensão do arquivo: .ape

M4A

É a extensão referente ao Apple Lossless Encoder. Criação da Apple, são as faixas de áudio de filmes com codec MPEG-4. É uma evolução do MPEG-1 e MPEG-2, formatos que armazenam áudio e vídeo simultaneamente.

É relativamente novo, portanto não tem suporte tão extenso. iPods da Apple, além de players da Sony e o Nintendo Wii são alguns dispositivos compatíveis. Como ponto negativo, não oferece muitas opções de codificação para o usuário.

Os tipos de arquivo mais comuns usando a extensão “m4a” são aquele usando o formato de áudio “AAC” (Advanced Audio Coding), mas outros formatos como “Apple Lossless” e mesmo “mp3” pode ser adicionados em um container “m4a”. Caso queira, normalmente você pode simplesmente renomear a extensão do arquivo “mp4” (desde que só contenha áudio) para “m4a”, e vice-versa, para reproduzir em seu tocador de mídia favorito.

FLACAPE e M4A em média digitalizam áudio com a metade do tamanho do arquivo original, podendo variar entre 40% e 60%. Esses formatos são bons para edição e para usuários que prezam pela qualidade máxima. Uma opção para um backup de sua coleção de CDs, por exemplo. Imagine que você fez toda sua coleção em MP3, e aí percebe que surgiu uma tecnologia melhor? Ao fazer o backup com uma tecnologia sem perda, as cópias permanecem fiéis aos originais independentemente dos avanços.

Mas vale lembrar que esses formatos não são tão comprimidos quanto os que você confere agora.

A conveniência da compressão

Há formatos de áudio que abrem mão da qualidade — até certo ponto — para ocupar menos espaço. São úteis para quem sofre com espaço ou quer carregar mais arquivos em um player, por exemplo. Eles são mais comuns porque, para o usuário em geral, a perda de qualidade não é algo notório.

MP3

Sem dúvidas, o MP3 é o formato mais popular, compatível com tudo o que é software e player de mídia. Criado na Alemanha, o formato utiliza a codificação perceptual, ou seja, codifica somente as frequências sonoras captadas pelo ouvido humano.

O seu bitrate (taxa de bits) é da ordem de kbps (quilobits por segundo), sendo 128 kbps a taxa-padrão, na qual a redução do tamanho do arquivo é de cerca de 90%, ou seja, o tamanho do arquivo passa a ser 1/10 do tamanho original. A taxa de bits pode chegar a até 320 kbps (cerca de 2,3 MB/min de áudio), gerando a máxima qualidade sonora do formato, na qual a redução do tamanho do arquivo é de cerca de 75%, ou seja, o tamanho do arquivo passa a ser cerca de 1/4 do original. Há também outras taxas intermediárias, como 192 kbps e 256 kbps, cuja escolha depende da relação custo-benefício desejada, onde o tamanho do arquivo pode ser reduzido em detrimento da qualidade/fidelidade do som. Para efeitos de comparação, as músicas de um CD de áudio comum possuem uma taxa de amostra de dados de 1411,2 kbps.

O método de compressão com perdas empregado na compressão do MP3 consiste em retirar do áudio tudo aquilo que o ouvido humano normalmente não conseguiria perceber, devido a fenômenos de mascaramento de sons e de limitações da audição humana (embora pessoas com ouvido absoluto possam perceber tais perdas). O ouvido humano consegue captar frequências de 20 Hz até 20 kHz.

Extensão do arquivo: .mp3

O MP3 popularizou o compartilhamento de músicas.

A razão do sucesso do MP3 é o fato de conseguir equilibrar bons índices de compressão e qualidade. Há, sim, a perda de qualidade se comparado com o original, mas em níveis praticamente imperceptíveis para a maioria dos usuários. O MP3 chega a criar arquivos com 10% do tamanho de arquivos PCM.

MP3 chega ao máximo de 320 kbps. Entre 192 kbps e 320 kbps, a qualidade é comparável a um CD. Entre 128 kbps e 192 kbps, algumas pessoas já constatam perda de qualidade, mas isso depende muito de quem ouve.

OGG

É um formato não proprietário e até mesmo com melhores taxas de compressão que o MP3. Porém, a explosão do MP3 faz com que o suporte e a divulgação para OGG encontre muitas dificuldades. Além disso, o fato de ser código aberto dificulta a padronização do formato.

Os desenvolvedores afirmam que o formato foi desenvolvido para “substituir completamente todos os formatos patenteados e proprietários”. O MP3 é uma extensão proprietária, e esse é o atrativo que o OGG tenta chamar em artistas e gravadoras. De uns tempos para cá, o OGG vem sendo consideravelmente utilizado em jogos.

É usado por profissionais para transmissões pela rede mundial de computadores e sistemas de comunicações terrestres. O Vorbis está em todo lugar, até mesmo em jogos eletrônicos.

Extensão de arquivo: .ogv, .oga, .ogx, .ogg

AAC

Sigla para Advanced Audio Coding (Codificação Avançada de Áudio, em tradução livre) é considerado o mais forte concorrente do MP3. O formato é baseado no padrão MPEG-4 e foi popularizado pela Apple, que aderiu ao formato no iPod e no iTunes, até mesmo vendendo os arquivos de áudio da loja nesse formato, em detrimento ao MP3.

Testes mostram que o formato AAC têm mais flexibilidade do que o MP3, como consequência maior qualidade de compressão. De maneira geral, o formato AAC tem melhor qualidade em taxas de bit menores (128 kbps, por exemplo).

O AAC não é um formato proprietário, apesar do que aparenta. A confusão se dá pela adoção da Apple, mas não se confirma. O AAC é suportado por dispositivos da Sony, PSP, Nintendo DSi, Xbox 360, Zune, iPod, iPhone, Windows Mobile. Em termos de software, Media Player Classic, BSPlayer, Foobar, AIMP e Winamp são alguns compatíveis.

Extensão de arquivo: .m4a, .m4b, .m4p, .m4v, .m4r, .aac, .3gp, .mp4

WMA

Formato da Microsoft, ele tem habilidades de cópias com proteção de conteúdo, em resposta aos problemas de distribuição que polemizam o MP3. É uma tecnologia proprietária com quatro codecs distintos:

– WMA como competidor do MP3;
– WMA Pro, mais moderno e com suporte para áudio de alta definição;
– WMA Lossless, que comprime sem perda de qualidade e;
– WMA Voice, destinado e conteúdos de voz com codificação em baixas taxas de bit.

O WMA surgiu com a promessa de criar arquivos equivalentes a MP3 com metade do tamanho, porém não vingou. No entanto, em taxas baixas, de 128 kbps, a qualidade dos dois é comparável.

Por que surgem?

Há uma infinidade de formatos de áudio. O site File Info, um banco de dados sobre extensões de arquivos, lista centenas deles, como você confere neste link. Aqui falei sobre apenas alguns deles que estão entre os mais populares ou em popularização crescente.

Como é possível perceber, eles surgem por interesses de empresas, necessidades de usuários, oportunidade, etc. O MP3 é o mais conhecido porque aliou tamanho pequeno com qualidade boa e se espalhou incontrolavelmente com o Napster. A partir daí, ganhou um público fiel. No entanto, isso não significa que ele seja o melhor.

A escolha do formato de áudio depende da sua necessidade. Como você viu, formatos que não sacrificam qualidade demandam espaço em disco, mas são ideais para fins de backup e para quem busca sonoridade avançada ou profissional.

Já os formatos comprimidos valorizam a conveniência, a compatibilidade com vários tocadores e o armazenamento de uma quantidade muito maior de músicas.

Fonte: Wikipedia

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.