Frame rate no cinema e na TV
Eduardo Baptista
coluna Fique Ligado, revista Zoom Magazine
Muitos de nós devem ter se divertido algum dia com a animação de imagens desenhadas em blocos de folhas de papel. Às vezes até mesmo no canto das folhas não usadas do caderno da escola, deixávamos cair em cadência rápida as folhas contendo desenhos, na maioria das vezes simples traços que mudavam de posição pouco a pouco. Ao deslizar o polegar e liberar as folhas, estávamos imitando o funcionamento do cinema.
Pois o cinema nada mais é do que uma sucessiva exibição de imagens, na quase totalidade dos casos umas ligeiramente diferentes das outras. Nosso cérebro não percebe no entanto uma série de imagens e sim um movimento contínuo, como se estivéssemos olhando a realidade acontecendo ali na frente. Isso porque, guardando alguma semelhança com as telas de tubo de imagem (CRT - Cathodic Ray Tube), que também retém durante algum tempo as linhas desenhadas em sua superfície interna pelo canhão de elétrons (característica da camada de fósforo ali existente), nossa retina retém durante algum tempo as imagens ali projetadas. Esse fenômeno, denominado persistência retiniana, pode ser observado ao fecharmos rapidamente os olhos: durante frações de segundos ainda continuaremos vendo a imagem do local onde olhávamos antes, escurecendo-se e apagando-se.
Durante muito tempo este fenômeno foi apontado como o único responsável pelo fato de percebermos continuidade nas imagens do cinema e da tv. Na tela do CRT, ele é o responsável pelas linhas, ao apagarem-se gradualmente, darem a percepção de continuidade aos movimentos das imagens que vemos no vídeo. No entanto, estudos neurológicos e fisiológicos nas últimas décadas tem mostrado que a ilusão de continuidade de movimento deve-se não somente a este fato, mas também à participação ativa do cérebro, que analisa as imagens e faz a interpretação e dedução dos movimentos. Ou seja, cérebro e retina trabalhariam juntos para que Angelina Jolie atravesse suavemente a tela de um lado para outro em direção a Brad Pitt.
Seja como for, quando vemos essa cena no cinema, estamos na realidade vendo 24 fotos, mais apropriadamente denominadas fotogramas, exibidas sequencialmente em 1 segundo. Chamando cada fotograma de "quadro", teremos os famosos "24qps". Mas... será que estamos vendo mesmo ali 24 imagens projetadas por segundo na tela?
Experiências feitas nas primeiras décadas do século passado mostraram que existe um fenômeno que ocorre juntamente com a ilusão do movimento descrita acima: o chamado flicker. Se conectarmos um dispositivo eletrônico de controle do tipo liga-desliga a uma lâmpada, e esta lâmpada for do tipo que acende e apaga instantaneamente (como um LED - Light Emission Diod e não como uma lâmpada incandescente por exemplo), podemos fazer algumas experimentações. Se a luz acende e apaga somente algumas poucas vezes por segundo, perceberemos naturalmente o fato. Aumentando pouco a pouco a cadência do seu ligar e desligar, ainda assim iremos percebendo a lâmpada piscar, mas cada vez mais rapidamente. Em dado momento, poderemos estar fazendo a lâmpada ficar acesa 24 vezes por segundo, e apagada 24 vezes por segundo também. Neste caso, estamos dividindo o tempo de 1 segundo em 48 partes iguais e alternando entre elas os estados "lâmpada acesa" / "lâmpada apagada". Estaremos vendo 24 vezes por segundo a lâmpada acender, a mesma cadência utilizada no cinema. No entanto, mesmo assim, também estaremos vendo a lâmpada piscar, ou seja, não haverá a sensação de uma luz continuamente acesa.
Foi isso o que se percebeu ao projetar os 24 quadros por segundo do cinema: o fenômeno do flicker ou cintilação das imagens, altamente desagradável ao expectador. Mas essas mesmas experiências haviam já apontado que, acima de 48 imagens exibidas por segundo, o olho humano praticamente não seria mais capaz de perceber o fenômeno. Então o obturador existente no projetor do cinema (necessário para esconder o filme para que o motor elétrico possa puxá-lo deslocando-o e posicionando o próximo quadro a ser exibido) foi melhorado, passando a girar mais rapidamente e mostrar duas vezes a mesma imagem antes que ela fosse trocada. Assim, o cinema exibe 48 imagens por segundo, correspondentes aos mesmos 24 quadros por segundo de sua cadência normal. Com esse recurso, diminui-se bastante o problema do flicker, praticamente anulando-o.
Foi quando começaram as primeiras experiências práticas para a criação da TV como a conhecemos. Os engenheiros da época, sabendo do problema do flicker, pretendiam fazer com que uma alta cadência de quadros fosse exibida para o expectador. Como, por motivos técnicos, havia-se decidido atrelar essa cadência à frequência da corrente elétrica distribuída no país (no caso, EUA, em 60Hz), pretendia-se que a TV funcionasse exibindo 60 quadros por segundo. Porém isso não foi possível devido a diversas limitações existentes até então. Uma delas, a largura de banda de transmissão. Se hoje discute-se diversas questões relativas à transição das transmissões de tv analógicas para as digitais e para as digitais de alta alta definição, se hoje temos internet em banda larga espalhada por todos os cantos e dezenas de satélites de comunicação existem orbitando o planeta o tempo todo, naquela época todo esse universo de troca de informação era ainda extremamente incipiente. O mundo conhecia o rádio, mas não a TV, que apoiava-se naquele para desenvolver este. Se fosse possível enviar para o ar os desejados 60 quadros por segundo, estaria resolvido o problema do flicker, de maneira ainda mais perfeita do que no cinema.
De volta às suas pranchetas de desenho, os engenheiros criaram então, naqueles distantes anos da década de 40, um sistema de transmissão de imagens onde as mesmas eram divididas em 2 pedaços. Enviava-se para o ar metade da imagem - isso era possível - depois a outra metade. O resultado prático não ficou bom, então desenvolveu-se algo ainda melhor: misturar essas metades. A mistura era feita através do intercalamento das linhas. Sendo as imagens desenhadas linha após linha na TV, bastava enviar metade delas (o chamado campo, como visto acima) e depois a outra metade. Surgia assim o sistema entrelaçado (interlaced). Haviam ainda outros motivos, como o tempo de resposta da camada de fósforo que recobria os CRTs da época. Ela retinha a luminosidade por um tempo muito grande para receber um novo desenho de imagem (nova linha de outro quadro) na cadência pretendida de 60qps: uma imagem misturaria-se com a seguinte.
Todos esses fatores levaram a criação da TV com os 60 campos que conhecemos hoje: em 1 segundo, são mostrados alternadamente 30 campos pares e 30 campos ímpares. Juntando-se um campo par com um campo ímpar, temos um quadro completo da tv. No entanto, em dado momento, sempre está sendo exibido na tv (ou transmitido no cabo ou via ar ou ainda sendo gravado) um campo, nunca um quadro completo. Assim, embora seja de uso corrente dizermos que a tv neste sistema (NTSC - National Television Standards Commitee) trabalha a 30qps, o termo mais apropriado é 60i, notação para os 60 campos entrelaçados (interlaced). Posteriormente outros sistemas iriam surgir, como o PAL (Phase Alternate Lines) e o SECAM (Systeme Electronique Couleur Avec Memoire). A idéia de atrelar a cadência das imagens (tecnicamente conhecida como frame rate) à cadência da ciclagem da corrente elétrica permaneceu e devido a este fato, surgiram sistemas PAL e sistemas SECAM trabalhando tanto em 50 campos por segundo como em 60 campos por segundo (50i / 60i). Por este motivo, o PAL utilizado em Angola trabalha com 50 "quadros"/seg e o utilizado no Brasil com 60 "quadros"/seg, ou como se usa correntemente, PAL 50 e PAL 60. Da mesma forma o SECAM utilizado na Colômbia é SECAM 60 e na França, SECAM 50.
Essa diferença de frame rates persistiu durante décadas nos sistemas analógicos mundiais e continuará persistindo nos sistemas de tv de alta definição HDTV e nos sistemas de captação de imagens em HD, como por exemplo o formato HDV ou o formato DVCPRO HD. Ao adquirir uma câmera que trabalhe somente com definição padrão (SD - standard definition), como por exemplo uma câmera Mini-DV ou Digital Betacam, podemos escolher entre PAL e NTSC. Mas ao adquirir uma câmera HD, essa escolha torna-se 50Hz / 60Hz, não PAL / NTSC. Isso porque estes últimos são padrões analógicos, adaptados posteriormente para exibir imagens de modo equivalente, com um pouco mais de definição. Mas os padrões HD não utilizam eses sistemas. De novo, popularmente, mas incorretamente, fala-se às vezes em "HD PAL" e "HD NTSC", mas esses termos não existem: o correto é HD 50Hz e HD 60Hz, em referência aos diferentes frame rates por eles utilizados.
Frame rate: o mundo das comunicações utiliza diversas outras cadências em aplicações mais específicas, mas os números 24qps / 50i / 60i permanecerão durante muitos anos a nosso lado.