Um é pouco...
Eduardo Baptista
coluna Fique Ligado, revista Zoom Magazine
Um é pouco, dois é bom, três.... o conhecido ditado não funciona para o vídeo: três não são demais, três é o número ideal! Estamos falando de sensores de imagem nas câmeras de vídeo, os conhecidos CCD e os não tão bem conhecidos CMOSs. Tanto uns como outros, CCDs (Charge Coupled Device) e CMOSs (Complementary Metal Oxide Semiconductor) aparecem nas câmeras sozinhos ou montados em conjuntos de três.
O motivo para isto é o que vamos analisar aqui e para que você entenda melhor a questão, é preciso de início imaginar como funciona um sensor de imagem. E para isso devemos entender o que é imagem. Só existe "imagem" se existir algo chamado contraste. E você pode deduzir isso facilmente: em qualquer sistema que permita efetuar ajustes em imagens, seja um software ou um aparelho do tipo televisor / monitor, ao aumentar exageradamente o controle de contraste, o que é branco vai ficando pouco a pouco mais escuro, e o que já era escuro torna-se preto total. O limite desse aumento é uma chapa totalmente negra, sem imagem alguma. Por outro lado, diminuir esse contraste totalmente vai tender para uma imagem cada vez mais clara, o que chamamos "lavada". e essa "lavagem" vai atingir o branco total. De novo, sem imagem alguma. Os contornos, os volumes e consequentemente os limites dos objetos dentro de um quadro de imagem só existem se houver algum contraste.
É isso o que faz a fotografia em película, quando os grãos de prata são expostos à luz e começam a sofrer transformações químicas. Como vimos, uma imagem é formada por áreas contrastantes, o que significa áreas mais claras do que outras. Quanto mais clara a área em uma determinada região do motivo fotografado, mais luz ela emite e portanto mais luz atinge os grãos de prata sensíveis à luz no trecho do filme sobre o qual a objetiva projeta essa imagem. Assim, ao término de determinado intervalo de tempo, algumas áreas do filme receberam mais luz do que outras. Se esse tempo for indefinido todos os grãos acabarão sofrendo a mesma transformação, por igual, e não teremos imagem alguma. Portanto é preciso em determinado ponto "cortar" essa exposição, trabalho este feito por uma peça chamada obturador.
Do filme para o sensor
Sair do filme e chegar nos sensores das câmeras de vídeo e foto digitais é muito fácil: basta trocar os grãos de prata acima descritos por minúsculas janelas sensíveis à luz. Essas janelas, em tamanho extremamente pequeno, são dispostas organizadas em fileiras, umas abaixo das outras, no painel conhecido como CCD ou como CMOS. Cada fileira forma uma linha, contendo centenas e centenas de janelas, denominadas pixels.
Da mesma forma que os grãos de prata, cada uma dessas janelas é sensível à luz, e também da mesma forma sua transformação com a exposição à luz é cumulativa. Quanto mais tempo exposto à luz mais os grãos de prata se transformam, quanto mais tempo exposto à luz mais os pixels geram energia. Sim, porque eles funcionam através do processo fotoelétrico, onde a luz que os atinge é transformada em energia elétrica. Um pixel recebendo pouca luz vai gerar uma corrente elétrica com baixa voltagem, outro pixel recebendo muita luz vai gerar uma corrente com voltagem maior. Para descobrir as voltagens das correntes geradas por cada pixel, e consequentemente se naquele ponto a luz era mais ou menos intensa, recorre-se a um "truque": armazenar a energia gerada em acumuladores elétricos extremamente pequenos, na verdade um para cada pixel. Imagine então milhares de "copos d'água", alguns mais cheios e outros menos: são os acumuladores ao cabo de determinado tempo de exposição. O que tem que ser feito agora é "ler" a imagem ali registrada.
Revelando o filme e lendo o sensor
No filme a película passa por um processo químico que irá remover os cristais ainda não transformados: a partir desse momento a imagem não muda mais e pode ser exposta novamente à luz. No sensor, o que se faz é proceder à leitura das cargas acumuladas em cada pixel, um a um, linha por linha. Após a leitura, o acumulador é esvaziado (o copo é esvaziado) ficando pronto para registrar a próxima imagem. O resultado dessa leitura é um sinal elétrico variável (voltagem), consistindo no sinal de vídeo analógico. A seguir, um processo de conversão irá transformá-lo em uma sequência de zeros e uns, o conhecido sinal digital, que poderá então ser gravado na fita, disco ou memória da câmera (nas câmeras analógicos, era o sinal sem conversão que era gravado diretamente na fita).
Onde estão as cores?
Se pensarmos em cores, deveremos lembrar que para reproduzir as cores existentes na natureza só precisamos de algumas cores especiais. Existem vários conjuntos delas, em número de 3 cada, denominadas color spaces. Em vídeo utilizamos o color space RGB, que trabalha com as cores vermelha (RED), verde (GREEN) e azul (BLUE), combinando-as em diferentes proporções. Essa combinação com intensidades variadas forma todas as cores que conhecemos. No filme, para conseguir-se esse registro, trabalha-se com várias camadas de filmes, formando um sanduíche, onde cada camada é sensível a uma determinada cor de um conjunto de 3 do color space utilizado nas películas. Mas em vídeo... existe esse sanduíche?
Sim e não. Sim em alguns equipamentos avançados e caros utilizados em captação digital para cinema: trata-se do processo chamado film stream. E em alguns equipamentos utilizados em fotografia que usam um sistema chamado Foveon. No entanto, em 99% dos casos o equipamento que está a seu lado provavelmente utiliza o sistema clássico de registro de imagens. Nele, não existem camadas, apenas um único sensor registra a imagem, ou então, como veremos logo adiante, três deles. Porém, em nenhuma situação esses sensores, sejam CCDs ou CMOS registram cores. Tanto um como outro "enxergam" tudo em P&B.
Fazendo surgir as cores
Se você reler o texto até aqui perceberá porque os sensores não vêem as cores: Porque só enxergam intensidades de luz, ou seja, mais ou menos claro, não "mais amarelo" ou "menos azul". É preciso realizar algum "truque" para que as cores surjam. O mais simples deles parece, à primeira vista, bem primitivo, mas é empregado em todas as câmeras de vídeo e fotografia digital que possuem apenas um sensor: consiste em recobrir cada pixel com um filtro colorido, alternando-se as cores entre o verde, o vermelho e o azul. Obviamente que com isso determinado pixel passará a enxergar somente a cor do filtro que o recobre, seja ela azul, vermelho ou verde. Dirá então você, com razão: a resolução de cor da imagem registrada com esse sistema não é prejudicada? A resposta é, de novo, sim e não. Sim, se considerarmos a imagem com a maior qualidade possível, para emprego em sistemas de edição com qualidade profissional, geração e envio de sinais no padrão broadcast ou mesmo realização de determinados efeitos em estúdio, entre eles o conhecido cromakey. Sim, é possível fazer tudo isso com equipamentos que possuem sensor único, mas a custa de qualidade padrão na imagem.
A parte "não" da resposta é consequência do parágrafo anterior: em todas as aplicações onde alta qualidade de imagem não seja prioritária o sistema funciona muito bem, como nas câmeras para usuários do segmento consumidor e mesmo semi-profissionais. No caso da fotografia, os sensores podem empregar uma quantidade muito maior de pixels, o que compensa a referida diminuição, uma vez que a foto não é, como o vídeo, atrelada a um valor fixo de resolução por quadro de imagem (inerente ao formato utilizado).
A moral da história é que sendo muito pequenos e próximos, os pixels mesmo carecendo de maior precisão na resolução de cores, produz imagens aceitáveis para os equipamentos desses segmentos.
De um para três
O outro "truque" consiste em utilizar não um, mas três sensores. Você pode até advinhar: um para cada uma das cores do color space RGB. A luz, ao penetrar dentro da câmera após ter passado pelas lentes, é desviada para três caminhos diferentes, através de prismas que atuam como espelhos ao terem uma de suas faces externa recoberta com uma camada refletiva. Mas não é uma camada refletiva com refletividade total, como a que os fabricantes utilizam para fazer os espelhos que estão em nossas casas. É uma camada refletiva que seleciona as cores a serem refletidas. Desta forma, em um dos prismas toda a luz vermelha é desviada para seu caminho próprio, o mesmo acontecendo com a luz azul em outro dos três prismas. Seguindo cada qual seu caminho, irão atingir individualmente sensores reservados só para essas cores. Dessa forma, acaba o problema de determinado pixel ser "colorido" artificialmente através de um filtro só de uma cor: cada pixel pode ter a cor real que possui naquele ponto da imagem.
A maior resolução de cores nesse sistema é exigida para todas as aplicações broadcast, o que faz com que as câmeras utilizadas no segmento profissional possuam todas elas três sensores de imagem.
Nos últimos anos a tecnologia tem permitido a criação desses blocos de prismas, chamados beam spliters (divisores de fachos de luz) em tamanho reduzido e com custo menor, possibilitando sua instalação até em algumas câmeras utilizadas por hobbystas.
Um ou três? A decisão deve-se basear, como sempre, no objetivo final a ser obtido com o vídeo, o segmento onde vai ser empregado e o nível de qualidade exigido.