quarta-feira, 20 de agosto de 2008

avi, mp3, vorbis, flac, que sopa de letrinhas!!!!!



Hoje é cil a gente ver um player pendurado na cintura ou no pescoço de muita gente. Eu estava outro dia em Belo Horizonte e observei que muita gente usava algum player. Com a natural evolução tecnológica dos dispositivos de armazenamento, eles incorporaram mais recursos e diminuiram o tamanho. Há 2 anos eu comprei um pen-driver de 1 GB por R$180,00, neste final de ano comprei um player mp4 por R$120,00. Aumentou a tecnologia, diminuiu o preço e o tamanho.

Quando os CDs passaram efetivamente a fazer parte de nossas vidas e o LP foi sendo abandonado por causa de suas limitações, entramos efetivamente numa era sonora digital. Ao invés das gravações feitas em plástico como nos LPs e fitas K7, passamos a ter o som arquivado em mídias que guardavam informações binárias. Esta mudança abriu um mundo de possibilidades que nós normalmente não percebemos.

A primeira mudança, não a mais importante, foi o tipo de mídia como forma de armazenam
ento. A fita K7 e o LP eram muito sensíveis. A fita K7 podia perder suas informações/músicas se ficasse perto de um imã. O LP facilmente era danificado por um arranhão. Quem já não chorou ao ver aquele seu amado LP de Roberto Carlos tocando e dando aquele salto irritante? puk, puk, puk... Num CD, a possibilidade de dano era menor pois a mídia não tinha contato direto com o leitor, o canhão laser.

Um outro fator interessante era o
chiado. No CD o chiado era eliminado por completo caso a gravação original, desde a captura do áudio fosse feita digitalmente. Nas mídias anteriores, principalmente o LP, o chiado era inerente ao som.

Haverá uma eterna discussão entre a qualid
ade sonora do LP versus CD. Os que defendem o LP, mesmo com suas limitações citadas, defendem que a gravação analógica consegue captar um espectro maior da real execução do instrumento, coisa que não é possível numa gravação digital. Esta argumentação é interessante. Teoricamente nenhuma mídia consegue capturar, em toda sua extensão a qualidade musical de um instrumento, ou seja, a execução ao vivo é sempre mais rica que sua própria gravação. Este assunto é realmente delicado e vamos discutir num artigo à parte.

Vejamos alguns dos formatos digitais de áudio

O Formato MP3

Com o avanço da internet, que deixou de ser apenas para uso militar, depois de instituições de pesquisa e ensino e passou a ser de acesso público. Começou-se a criar um fato novo nas relações de comunicação.


Enquanto não havia o correio eletrônico, as mensagens eram feitas e trocadas por meio de cartas. Com o nascimento e crescimento da internet, a comunicação eletrônica, o e-mail, passou a fazer parte do cotidiano de um número cada vez maior de pessoas.

Por sua vez, o www criou um sem número de sites e recursos que foram evoluindo desde o html puro e simples, passando pelas páginas dinâmicas e chegando até às transmissões multimídias, onde o áudio e o vídeo juntos compõem um novo meio de comunicação.

Neste momento a mídia digital, o cd onde a música era armazenada impedia que a transmissão da música pela internet fosse algo ainda imprecisa e lenta.

Vamos entender um pouco o porquê disso.


Na hora da gravação, o microfone ou captador recebe o som e o transforma em um arquivo que será posteriormente mixado, inserido efeitos etc.


Este arquivo, em seu formato natural, tem uma taxa de 10 megas para cada minuto de execução. Ele é estéreo, com uma taxa de 44100 hz e 32 bits. Ele captou e guardou teoricamente um espectro musical muito grande. Notas muito altas e notas muito baixas. Captou também momentos em que os dois canais (left e right) se aproximaram um do outro, formando quase um canal mono.

Este formato não era realmente bom para a internet. Imagine uma música de 4 minutos sendo trocada por 2 amigos. Não era realmente viável. Foi neste contexto que começaram a surgir estudos para viabilizar alternativas.

Segundo o site wikipedia - http://pt.wikipedia.org/wiki/MP3, o formato mp3 foi o primeiro formato digital que se propôs a analisar o espectro sonoro de uma música qualquer e propor um algorítmo que mantivesse a qualidade próxima do original.

No site do Instituto Fraunhofer, eles tem a história da evolução do mp3 http://www.iis.fraunhofer.de/EN/bf/amm/mp3history/mp3history01.jsp

Segundo o site, o ano de 1987 foi o marco para o estudo do mp3. Uma parceria entre a Universidade de Nuremberg e o Instituto Fraunhofer, liderado pelo Prof. Heinz, começaram a estudar um algoritmo de compactação.


Em 1988 foi estabelecido o MPEG, um grupo de trabalho específico da ISO.


Em 1989 o Prof. Brandenburg termina sua tese de doutorado sobre o algoritmo OCF, um codec que seria a base do mp3.


Em 1991 um novo codec chamado ASPEC é apresentado como resultado das melhorias do codec OCF.


Apresentação da ASPEC 19 "racks estúdio de transmissão de voz e música através da RDIS fiável entre estúdios radiodifusão (1991, a partir da esquerda: Jürgen Herre, Martin Dietz, Harald Popp, Ernst Eberlein, Karlheinz Brandenburg, Heinz Gerhäuser).



Em 1994, surge o primeiro codificador/decodificador mp3.

Em 1995 o nome mp3 é dado ao projeto MPEG-1, Layer 3.


Formato ogg/vorbis (fonte: http://pt.wikipedia.org/wiki/Vorbis)

Vorbis é o nome de um projeto, liderado pela Xiph.org Foundation, que desenvolveu um algoritmo de compressão/descompressão (codec) de áudio, livre de patentes. Os arquivos codificados com o codec Vorbis são frequentemente usados em conjunto com o formato Ogg, sendo então conhecidos como Ogg Vorbis.

O projeto Vorbis foi iniciado após uma mensagem da Fraunhofer Gesellschaft em Setembro de 1998, a anunciar os planos de cobrar licenças de utilização para o popular formato MP3. Pouco tempo depois Christopher Montgomery iniciou o projeto, sendo auxiliado por um crescente número de voluntários, que continuaram a aperfeiçoar o código até ser lançada a versão 1.0 do codec em 19 de Julho de 2002.

Ao contrário do formato MP3, o Vorbis utiliza uma codificação em bitrate variável (VBR) o que permite obter arquivos mais compactos para uma qualidade de som semelhante, ou melhor qualidade para a mesma dimensão de arquivo.

Além das diferenças técnicas, a outra grande diferença entre o MP3 e o Ogg Vorbis é que enquanto o primeiro formato é proprietário, o segundo é livre, com uma licença BSD para as bibliotecas e GPL para as ferramentas.

Devido ao fato de o MP3 ter atingido uma grande popularidade durante a década de 1990, o formato Vorbis é ainda bastante minoritário. Apesar disso, a qualidade do codec e a licença livre têm conquistado adeptos, especialmente junto dos que receiam que as patentes do formato MP3 venham a limitar a disponibilidade desse formato.


Formato Flac

FLAC (acrônimo de Free Lossless Audio Codec, que significa Codec de Áudio Sem Perda Livre em inglês) é um codec de compressão de áudio sem perda de informação. Ao contrário de codecs com perda tais como o MP3 e o Vorbis, ele não remove nenhuma informação do fluxo de áudio, mantendo a qualidade do som.

Josh Coalson é o autor original do FLAC. Em 29 de Janeiro de 2003, Xiphophorus (agora conhecida como fundação Xiph.Org) anunciou a incorporação do FLAC sob sua bandeira juntamente com Vorbis, Ogg, Theora, Speex, e outros


O projeto FLAC se compõe de:

  • o formato de stream;
  • um container de formato para o stream, também chamado de FLAC (ou FLAC Nativo);
  • libFLAC, uma biblioteca de referência de codificadores e decodificadores, e uma interface de metadados;
  • libFLAC++, um object wrapper para a libFLAC;
  • flac, um wrapper em linha de comando para utilizar a libFLAC para codificar e decodificar streams em FLAC;
  • metaflac, um editor de metadados em linha de comando para arquivos .flac e para a aplicação de Replay Gain;
  • plugins de entrada para vários tocadores de áudio (Winamp, XMMS, foobar2000, musikCube, e muitos mais);
  • Com a incorporação à Xiph.org, o container de formato Ogg, adaptável à streaming (também chamado de Ogg FLAC).

"Livre" significa que a especificação do formato de stream pode ser implementada por qualquer pessoa, sem necessidade de autorização expressa (a Xiph.org se reserva o direito de definir a especificação do FLAC e certificar a conformidade aos mesmos), e nem o formato FLAC, nem nenhum método implementado para codificá-lo/decodificá-lo são cobertos por patentes. Isso também significa que a implementação referencial é software livre e os códigos-fonte da libFLAC e da libFLAC++ são disponíveis sob a Licensa BSD da Xiph.org, e os códigos-fonte do flac, metaflac, e também os plugins estão disponíveis sob a GPL.


O FLAC foi criado para um empacotamento eficiente de dados de áudio, diferente de algoritmos gerais de compressão sem perda, como ZIP e gzip. Enquanto um ZIP pode compactar um arquivo de áudio com qualidade de cd em 10% ou 20%, com FLAC pode-se alcançar taxas de compressão de 30% a 50%.

Codecs com perda de dados podem alcançar taxas de 80% ou mais, descartando dados do stream original. O FLAC utiliza predição linear para converter amostras do áudio em uma série de pequenos números não correlatos (o residual), que são armazenados eficientemente com o uso do algoritmo Golomb-Rice. Ele também utiliza codificação de run-length para blocos de amostras idênticas, como passagens silenciosas. As vantagens técnicas do FLAC comparado a outros codecs sem perda residem na sua habilidade de streaming e em um rápido tempo de decodificação, que independe do nível de compressão.

Como qualquer outro codec sem perdas, o formato FLAC é popular entre proprietários de CDs e outras mídias que desejam preservar suas coleções de áudio. Se a mídia original foi perdida ou danificada, uma cópia em FLAC garante que uma duplicata exata do original pode ser recuperada a qualquer instante. Uma restauração exata feita a partir de um arquivos com perda (ex., MP3) dos mesmos dados é impossível. Um arquivo CUE pode opcionalmante ser criado ao copiar-se um CD. Se o CD foi lido e copiado peerfeitamente em arquivos FLAC, o arquivo CUE permite posteriormente a gravação de um CD de áudio idêntico ao original, incluindo ordem das faixas, pregaps, e CD-Text. Entretanto, dados adicionais presentes em alguns CDs, como letras e gráficos de CD+G estão além do escopo de um arquivo CUE e da maioria dos softwares de cópia de CDs, portanto, esses dados não serão armazenados.


O formato Wav

WAV (ou WAVE), forma curta de WAVEform audio format, é um formato-padrão de arquivo de áudio da Microsoft e IBM para armazenamento de áudio em PCs.

É uma variação do método de formatação de fluxo de bits RIFF para armazenar dados em blocos (chunks) e também parecido com os formatos IFF e o AIFF usados em computadores Macintosh. Ambos WAVs e AIFFs são compatíveis com os sistemas operacionais Windows e Macintosh. São levadas em conta algumas diferenças nos processadores Intel como a ordem de bytes "little-endian". O formato RIFF age como um "empacotador" (wrapper) para vários codecs de compressão de áudio. É o principal formato usado nos sistemas Windows para áudio simples.

Apesar de um arquivo WAV poder conter áudio compactado, o formato mais comum de WAV contém áudio em formato de modulação de pulsos PCM (pulse-code modulation). O PCM usa um método de armazenamento de áudio não-comprimido (sem perda). Usuários profissionais podem usar o formato WAV para qualidade máxima de áudio. Áudio WAV pode ser editado e manipulado com relativa facilidade usando softwares.

Por ser um formato sem compressão, o WAV ocupa um espaço muito grande de armazenamento, o que pode ser resolvido convertendo o arquivo para outros formatos, tais como mp3 ou Ogg-Vorbis.

Limitações do formato wave

O formato WAV é limitado a arquivos menores de 4 GiB, devido ao uso de inteiros de 32 bits para gravar o campo de tamanho no cabeçalho de arquivo(alguns programas limitam o tamanho do arquivo para 2 GiB). Apesar disto ser equivalente a aproximadamente 6.6 horas de áudio em qualidade de CD(44.1 kHz, 16-bit estéreo), em algumas situações é necessário ultrapassar esse limite. O formato W64 foi então criado para usar no Sound Forge. O seu cabeçalho de 64-bit permite gravações muito mais longas. Este formato pode ser convertido usando a biblioteca libsndfile. O formato RF64, especificado pela União Européia de Transmissão (European Broadcasting Union), também foi criado para resolver este problema.

CDs de Áudio

CDs de áudio não usam WAV como formato de som. Em vez disso, usam o Red Book Audio. O ponto em comum é que ambos têm o áudio codificado em PCM. WAV é um formato de arquivo de dados para uso no computador. Se um CD de áudio fosse codificado em um arquivo WAV e em seguida gravado num CD-R usando um CD de dados(no formato ISO), o CD não tocaria em um aparelho de som que foi projetado para tocar CDs de áudio.

Conclusão

Não há volta, estamos num mundo digital. Até a TV agora é digital. Parece que estamos num filme de ficção científica como "Blade Runner - O Caçador de Andróides", ou "Minory Report", tudo digital, instantâneo. Só falta a Rose, aquela robozinha dos Jetsons chegar e servir um copo de refri.

Como diria Robin: "Santa confusão de siglas Batman"


Sobre o autor

Hermes Nunes Pereira Júnior, o hnpjunior, trabalha com Linux desde 1997, quando conheceu o Conectiva 3, cujo codinome era "Guarani". Hoje trabalha com o Debian Etch. Tem artigos escritos no Viva o Linux, na Revista Fedora Brasil, além de ser editor do site GNU-Lia, que aborda o uso de softwares livres para edição de áudio e vídeo. Está desenvolvendo um curso de teoria e prática musical a distância usando softwares livres.

2 comentários:

  1. Amigo, por favor, quer dizer então que, se passar arquivos flac para um CD-R, fica como o original?
    Obrigado.

    ResponderExcluir
  2. Caro Pablito,

    Isso mesmo, se vc usar tiver um cd que foi "ripado" como .flac, vc tem uma imagem do cd. Podemos dizer que é algo semelhante a um .iso.

    É só usar um software de gravação de cds, pegar este arquivo .flac e mandar para o cd.

    Você terá o cd com a qualidade de cd...

    Muito legal né?

    ResponderExcluir