Serviços de Áudio na DAB

Serviços de Áudio na DAB

Os serviços de Áudio na DAB usam o MPEG I/II Audio Layer II, fornecendo programas em mono, estéreo e multicanal. Na figura 13 está representado o diagrama de blocos do ISO/IEC MPEG-1 Audio Layer II designado também por MUSICAM. Analisando o diagrama verificamos que, tal como outros codecs (MP3, AAC, …) o Layer II é baseado na codificação de áudio perceptível.

Fig. 13 Diagrama de Blocos do MPEG-1 Audio Layer II

Felizmente para a codificação de áudio o nosso ouvido é bastante imperfeito, já que não ouvimos abaixo de um determinado nível como se pode ver na figura 14 (região a azul). Outro problema é quando somos expostos a um tom numa determinada frequência, esta faz excitar a parte interior do ouvido de um certo modo em que um sinal próximo (em frequência) possa ser inaudível, se o seu nível for suficientemente baixo. Como exemplo, pode-se observar na figura 14 que ao introduzirmos um tom em 1KHz (região cor-de-rosa), este vai modificar a linha de masqueamento, sendo quaisquer outros sons acústicos na proximidade dessa região inaudíveis (região amarela).

O modelo psycho-acoustic calcula o limite crítico auditivo para cada uma das 32 sub-bandas do filter bank (o sinal é dividido em 32 sub-bandas idênticas que definem a totalidade do sinal na região de frequências audíveis), sendo este modelo só necessário na fonte torna o descodificador bastante mais simples e barato.

A FFT serve para garantir que os sinais que vão determinar o nível de masqueamento são só os tons relevantes (sinusoidais), desprezando assim os sons não tonais (ruídos), pois estes não têm influência na linha de masqueamento. Isto é apenas os sons tonais definem o nível audível (linha de masqueamento).

Fig. 14 - Linha de masqueamento para o ouvido humano

As amostras das sub-bandas são representadas por uma combinação de um factor de escala e o valor das amostras actuais. O factor de escala para cada sub-banda é o valor absoluto máximo de 12 amostras, sendo este quantizado numa palavra de 6 bits de comprimento, cobrindo uma gama dinâmica de 120dB por sub banda com uma resolução de 2 dB´s. Esta técnica adicional permite reduzir a taxa de bits.

Na quantização cada uma das 12 sub-bandas de um bloco é normalizada, isto é, dividir o seu valor pelo factor de escala sendo o resultado quantizado de acordo com o número de bits por bloco de alocação. Os níveis de quantização vão depender da frequência podendo variar entre 3 e 65535.

Trama de Áudio em DAB

Cada trama começa com um cabeçalho seguido da alocação de bits de informação, o factor de escala e as amostras quantizadas e codificadas.

A trama é em formato MPEG-2, embora tenha uma parte compatível com o MPEG-1 (ver figura 15).

O áudio MPEG-2 permite diferentes taxas de bits (entre 32kbit/s e 1066kbit/s), pois a trama do MPEG-2 é dividida em duas partes. A primeira transporta a parte compatível com o MPEG-1, atingindo um máximo de 384kbit/s. A outra parte (extension) transporta informação sobre o MPEG-2, servindo também para suportar taxas de bits acima de 384kbit/s.

Fig. 15 Trama do MPEG-2 e parte compatível com MPEG-1

Modos de Áudio

O sistema de codificação de áudio, usado na DAB, suporta os seguintes modos:

· Mono (um canal)

· Stereo (dois canais)

· Dual-channel Mode (para mais que um tipo de linguagem)

· Joint Stereo (esta técnica preserva o sinal de stereo, transmitindo a junção do R com o L)

· Low Sampling frequency coding fs=24 KHz

· MPEG-2 Audio Layer II 5.1 Surround (em testes)

Adicionalmente, cada trama de áudio da DAB contém bits que podem ser usados para conter a PAD (Programme Associated Data), que transporta informação relacionada com o programa de áudio, podendo ser transmitida como fixed PAD (F-PAD) ou extended PAD (X-PAD).

Exemplos de F-PAD:

· Dynamic Range Control (DRC) – pode ser utilizado no receptor para comprimir o alcance dinâmico do áudio.

· MUSIC/SPEECH – Balancear volume entre fala e música. Esta informação é usada no receptor para controlar o volume entre as músicas e a voz do locutor (entre 0 e -15db).

Fig. 16 - Trama MPEG-2 em detalhe

O DRC de um sinal de um programa de áudio é o alcance entre o sinal mais alto e o mais baixo. Isto é essencial para receptores em andamento. O DRC é gerado na fonte em que diz qual o ganho a ser gerado no receptor. Na parte do utilizador este pode escolher entre três modos:

- Sem compressão: o programa de áudio é reproduzido com o DRC tal e qual como é enviado pela fonte.

- Compressão Nominal: ajustável pelo o utilizador.

- Compressão Máxima: também ajustável pelo o utilizador, mas com uma margem maior que a compressão nominal (bom para veículos).

Protecção de Erros

Na presença de poucos erros (com um bit rate de 10^-5 a 10^-6 e menos), o CRC é em geral eficiente. Mas se existirem erros de um só bit no cabeçalho, ou na alocação de bits, ou ainda no factor de escala isto implica a perda total da trama.

Para evitar perdas de tramas utiliza-se um processo de codificação convolucional adicionando redundância ao serviço. No caso de um programa de áudio, é dada mais protecção a uns bits que a outros (UEP – Unequal Error Protection, como se pode observar na figura 17).

Fig. 17 – Atribuição de redundância conforme as partes mais relevantes da trama

No sistema DAB, (como se pode ver na Fig.16) existem as seguintes protecções de erros:

· Frame CRC – 16bit de paridade utilizada para protecção do cabeçalho, da alocação de bits e do factor de escala.

Scale Factor CRC – 8-bit para protecção das amostras das sub-bandas.