|
|
Serviços de Áudio na DAB
Os serviços de Áudio na DAB usam o MPEG I/II Audio Layer II, fornecendo programas em mono, estéreo e multicanal. Na figura 13 está representado o diagrama de blocos do ISO/IEC MPEG-1 Audio Layer II designado também por MUSICAM. Analisando o diagrama verificamos que, tal como outros codecs (MP3, AAC, …) o Layer II é baseado na codificação de áudio perceptível. Fig. 13 Diagrama de Blocos do MPEG-1 Audio Layer II
Felizmente para a codificação de áudio o nosso ouvido é bastante imperfeito, já que não ouvimos abaixo de um determinado nível como se pode ver na figura 14 (região a azul). Outro problema é quando somos expostos a um tom numa determinada frequência, esta faz excitar a parte interior do ouvido de um certo modo em que um sinal próximo (em frequência) possa ser inaudível, se o seu nível for suficientemente baixo. Como exemplo, pode-se observar na figura 14 que ao introduzirmos um tom em 1KHz (região cor-de-rosa), este vai modificar a linha de masqueamento, sendo quaisquer outros sons acústicos na proximidade dessa região inaudíveis (região amarela). O modelo psycho-acoustic calcula o limite crítico auditivo para cada uma das 32 sub-bandas do filter bank (o sinal é dividido em 32 sub-bandas idênticas que definem a totalidade do sinal na região de frequências audíveis), sendo este modelo só necessário na fonte torna o descodificador bastante mais simples e barato. A FFT serve para garantir que os sinais que vão determinar o nível de masqueamento são só os tons relevantes (sinusoidais), desprezando assim os sons não tonais (ruídos), pois estes não têm influência na linha de masqueamento. Isto é apenas os sons tonais definem o nível audível (linha de masqueamento). Fig. 14 - Linha de masqueamento para o ouvido humano
As amostras das sub-bandas são representadas por uma combinação de um factor de escala e o valor das amostras actuais. O factor de escala para cada sub-banda é o valor absoluto máximo de 12 amostras, sendo este quantizado numa palavra de 6 bits de comprimento, cobrindo uma gama dinâmica de 120dB por sub banda com uma resolução de 2 dB´s. Esta técnica adicional permite reduzir a taxa de bits. Na quantização cada uma das 12 sub-bandas de um bloco é normalizada, isto é, dividir o seu valor pelo factor de escala sendo o resultado quantizado de acordo com o número de bits por bloco de alocação. Os níveis de quantização vão depender da frequência podendo variar entre 3 e 65535.
Trama de Áudio em DAB
Cada trama começa com um cabeçalho seguido da alocação de bits de informação, o factor de escala e as amostras quantizadas e codificadas. A trama é em formato MPEG-2, embora tenha uma parte compatível com o MPEG-1 (ver figura 15). O áudio MPEG-2 permite diferentes taxas de bits (entre 32kbit/s e 1066kbit/s), pois a trama do MPEG-2 é dividida em duas partes. A primeira transporta a parte compatível com o MPEG-1, atingindo um máximo de 384kbit/s. A outra parte (extension) transporta informação sobre o MPEG-2, servindo também para suportar taxas de bits acima de 384kbit/s.
Fig. 15 Trama do MPEG-2 e parte compatível com MPEG-1
Modos de Áudio
O sistema de codificação de áudio, usado na DAB, suporta os seguintes modos:
· Mono (um canal) · Stereo (dois canais) · Dual-channel Mode (para mais que um tipo de linguagem) · Joint Stereo (esta técnica preserva o sinal de stereo, transmitindo a junção do R com o L) · Low Sampling frequency coding fs=24 KHz · MPEG-2 Audio Layer II 5.1 Surround (em testes) Adicionalmente, cada trama de áudio da DAB contém bits que podem ser usados para conter a PAD (Programme Associated Data), que transporta informação relacionada com o programa de áudio, podendo ser transmitida como fixed PAD (F-PAD) ou extended PAD (X-PAD). Exemplos de F-PAD: · Dynamic Range Control (DRC) – pode ser utilizado no receptor para comprimir o alcance dinâmico do áudio. · MUSIC/SPEECH – Balancear volume entre fala e música. Esta informação é usada no receptor para controlar o volume entre as músicas e a voz do locutor (entre 0 e -15db). Fig. 16 - Trama MPEG-2 em detalhe
O DRC de um sinal de um programa de áudio é o alcance entre o sinal mais alto e o mais baixo. Isto é essencial para receptores em andamento. O DRC é gerado na fonte em que diz qual o ganho a ser gerado no receptor. Na parte do utilizador este pode escolher entre três modos: - Sem compressão: o programa de áudio é reproduzido com o DRC tal e qual como é enviado pela fonte. - Compressão Nominal: ajustável pelo o utilizador. - Compressão Máxima: também ajustável pelo o utilizador, mas com uma margem maior que a compressão nominal (bom para veículos).
Protecção de Erros
Na presença de poucos erros (com um bit rate de 10-5 a 10-6 e menos), o CRC é em geral eficiente. Mas se existirem erros de um só bit no cabeçalho, ou na alocação de bits, ou ainda no factor de escala isto implica a perda total da trama. Para evitar perdas de tramas utiliza-se um processo de codificação convolucional adicionando redundância ao serviço. No caso de um programa de áudio, é dada mais protecção a uns bits que a outros (UEP – Unequal Error Protection, como se pode observar na figura 17). Fig. 17 – Atribuição de redundância conforme as partes mais relevantes da trama
No sistema DAB, (como se pode ver na Fig.16) existem as seguintes protecções de erros: · Frame CRC – 16bit de paridade utilizada para protecção do cabeçalho, da alocação de bits e do factor de escala. Scale Factor CRC – 8-bit para protecção das amostras das sub-bandas. |
|