Esse termo tornou-se comum hoje em dia, tanto em câmeras de vídeo como em players de DVD, tanto em gravações no âmbito profissional e semi quanto em home theaters. Mas, afinal, o que significa "progressive scan"?

Podemos começar falando sobre o "scan" do "progressive scan". Você deve lembrar de outra palavra parecida com essa, scan ... scan ... scanner !! Bingo, isso mesmo! O scanner, um periférico de computador, é utilizado para "escanear", ou "ler" o conteúdo impresso em um papel, seja ele composto por letras ou imagens e colocá-lo a seguir dentro do computador, sob a forma de um arquivo digital. Para realizar essa tarefa, a cabeça de leitura do scanner efetua um movimento percorrendo de alto a baixo a superfície do papel. O que se passa dentro da câmera de vídeo parece-se bastante com isso.

As lentes da objetiva da câmera projetam a imagem sobre uma superfície plana, sensível à luz, os chamados CCDs ou CMOSs (Charge Coupled Device ou Complementary Metal Oxide Semiconductor). É então preciso "ler" essa imagem ali projetada e transformá-la em um sinal digital de vídeo. Aqui, para realizar esta tarefa não existem peças móveis como no scanner: é um processo de leitura puramente eletrônico. A imagem na verdade é composta por um conjunto de linhas horizontais sobrepostas umas às outras. Cada uma dessas linhas contém uma fileira de minúsculos sensores individuais, os pixels. Nos formatos DV, como o Mini-DV por exemplo, existem 720 pixels em cada uma dessas linhas. E existem 480 linhas empilhadas. Na realidade, essa é a resolução desses formatos, 720 x 480, mas a quantidade de pixels no sensor ultrapassa esse valor, por diversos motivos técnicos, entre eles permitir o funcionamento de estabilizadores eletrônicos de imagem de algumas câmeras de vídeo e foto. Isso significa que existem normalmente mais pixels no sensor, mas que o conteúdo considerado para gerar o sinal de vídeo é uma janela menor dentro dele, com os 720 x 480 pixels referidos acima.

Cada uma dessas linhas é então lida pelo processo eletrônico, uma após outra, de cima para baixo. Após ter sido completada a leitura, temos um quadro de vídeo pronto para ser gravado. Essa é a descrição resumida do processo, mas na verdade o que se passa é um pouco diferente, com alguns detalhes a mais.

O mais importante deles é que em uma fase inicial de leitura, são lidas somente as linhas ímpares até completar o quadro. A seguir, e só neste momento, começa novamente a leitura de alto a baixo, só que agora somente com as linhas pares. Um conjunto de linhas assim formado (só ímpares, ou só pares) é denominado campo. Decorre portanto que temos o campo par e temos o campo ímpar. Eles são capturados pela câmera assim, são armazenados da mesma forma na fita / disco e são também exibidos na TV do mesmo modo. Esse sistema chama-se entrelaçado (interlaced), porque são capturadas / transmitidas / exibidas todas as linhas de um campo, depois todas as do outro, e assim por diante. A palavra "transmitidas" aqui mostra uma das justificativas técnicas da época em que a TV foi criada, para optar-se por este sistema - simplesmente não havia banda de transmissão disponível para transportar tanta informação - e isso considerando uma imagem ainda em P&B!

Basicamente, este é o processo entrelaçado de leitura efetuado a partir do conteúdo de imagem projetado no CCD / CMOS, em uso e patenteado pela RCA desde 1929. Temos então o processo progressivo. Mas agora fica mais fácil entender: o sistema eletrônico vai progressivamente lendo as linhas, uma a uma, sem "pular" nenhuma, de alto a baixo. Após ter sido completada a leitura, temos um quadro de vídeo pronto para ser gravado. Então, qual a diferença entre os 2 processos? Várias.

Uma delas aparece em cenas de movimento e está no tempo decorrido para uma determinada informação ser lida no CCD em uma linha e a seguir na linha de baixo. Pois, se esse linha for por exemplo a de número 45, todas as demais ímpares, até chegar a de número 479, serão lidas, depois a leitura vai-se reiniciar no alto com as linhas pares, sendo lidas mais 22 linhas até chegar a vez da linha 46. No sistema NTSC temos 30 quadros sendo exibidos a cada segundo. Como cada quadro, como vimos, é formado por 2 campos, temos que cada campo leva 1/60 seg. para ser formado. Assim, entre o registro do conteúdo da linha 45 e o da seguinte, 46, passam-se 1/30 seg. - o tempo necessário para ser efetuada a montagem dos 2 campos. Nesse intervalo de tempo a pessoa ou objeto em movimento já está ocupando uma posição ligeiramente diferente da posição em que estava no momento do registro da linha 45.

O fato de se registrar todas as linhas pares e somente depois todas as ímpares, se por um lado acarreta certa suavidade nos movimentos exibidos, por outro faz com que a imagem registrada em cada quadro individualmente apresente o deslocamento da imagem nos campos par / ímpar. Para se ter uma idéia, vamos imaginar o close de uma bola de basquete deslocando-se pelo ar, capturada em vídeo entrelaçado. No momento de ver a gravação, podemos pará-la, acionando o controle pause. A imagem mostrará então um deslocamento mínimo entre os campos, mas que pode ser percebido se comparássemos a mesma imagem obtida a partir de uma gravação feita em progressive scan. Imagine a figura da bola como um pão sírio colocado sobre a mesa. Com uma faca muito afiada, corte tiras horizontais todas com cerca de 1cm de largura. Agora desloque, de modo alternado, uma fatia 0,5 cm para a esquerda, a de baixo 0,5 cm para a direita, a seguinte o mesmo para a esquerda e assim por diante. Percebeu o que acontece? Então você pegou a idéia.

Porém não deve confundí-la com outro fator que altera as imagens de vídeo, principalmente as em movimento, que é a velocidade de obturador da câmera. Se essa velocidade for muito baixa, a imagem da bola deixará um "rastro" atrás de si, na verdade se parecerá com um borrão se deslocando no ar. Se a velocidade for maior, o rastro diminuirá. E se for muito alta, o rastro será praticamente invisível. Mas o efeito do deslocamento dos campos estará sempre lá: ele não depende da velocidade do obturador. Isso porque a velocidade real é sempre 1/30 quadros por segundo (NTSC), o que o obturador faz é "maquiá-la", deixando o CCD / CMOS exposto por um tempo menor ou maior do que isso. A seguir, a imagem resultante é montada no sinal de vídeo, sempre em 30 qps. Temos uma sequência de quadros com imagens que ficaram expostas um tempo menor do que 1/30seg ou então maior, conforme o ajuste efetuado na câmera.

Voltando agora ao nosso pão sírio: o processo entrelaçado não é ruim para o vídeo de modo geral, tanto é que quase todo o conteúdo de vídeo que assistimos é assim, desde as novelas na TV até o DVD alugado na Blockbuster. E ainda mais: vivemos na era da alta definição. Um dos padrões do formato HDV, aliás o mais utilizado até agora, é justamente o padrão onde 1080 linhas são registradas no modo entrelaçado. A exibição de imagens no modo progressive scan acarreta ligeira perda de suavidade e fluidez nos movimentos, pela falta dos campos entrelaçados e pela velocidade mais baixa no registro da imagem. No tempo que o sistema entrelaçado leva para desenhar um campo completo de linhas (ou só pares, ou só ímpares), o sistema progressivo desenha somente metade do quadro de imagem.

O fato porém é que para algumas aplicações de vídeo, a captação em progressive scan é muito importante. Uma delas é quando se deseja gerar imagens estáticas (fotos, geralmente no formato JPEG) a partir do vídeo. Ao isolarmos um determinado quadro da imagem, não existirá o efeito de deslocamento descrito acima. A outra aplicação é específica para câmeras que geram imagens fora do padrão NTSC, em velocidade diferente: 24 qps. Essa é a velocidade padrão utilizada no cinema, e fica fácil transferir, quadro a quadro, as imagens registradas em vídeo para exibição em película. E quando o conteúdo gravado permanece no mesmo meio (vídeo), sua apresentação adquire um visual que lembra o efeito de falta de fluidez nos movimentos apresentado pelo cinema, apesar de serem outros fatores - e não a velocidade - os responsáveis pelo chamado film look.

Finalmente, se foi dito acima que a velocidade padrão para o vídeo NTSC é sempre 1/30seg., com 2 campos entrelaçados, como é possível gravar nesse padrão imagens progressivas? Através de um "truque" utilizado pela câmera: os quadros de imagem lidos do CCD / CMOS são armazenados em uma memória interna (buffer) e ali trabalhados. De um quadro obtido através do scaneamento progressivo são retiradas todas as linhas pares e depois as ímpares, sendo gravadas então no modo entrelaçado tradicional. Mas, como foram montadas sequencialmente, ao se efetuar o congelamento (pause) da imagem, não aparecerá o efeito do deslocamento acima referido.

Temos com isso, resumidamente, algumas idéias sobre o scaneamento progressivo da imagem em vídeo.