O mundo em que vivemos é tridimensional, significando que onde estejamos, existirão pessoas e/ou objetos mais ou menos próximos de nós, outros bem próximos e outros bem distantes. E nós não conseguimos ver todos esses objetos, ao mesmo tempo, com a mesma nitidez. Nossos olhos passeiam constantemente pela realidade a nosso redor, fixando-se mais demoradamente no que nos chama a atenção. Quando vemos algo que precisamos ver ou algo que gostamos de ver, nossa vista "faz o foco" nesse local - tudo o que está para trás e tudo o que está para frente ficará menos nítido, menos focalizado. Quando se olha para o anel nos dedos tudo o que está atrás fica fora de foco. Se então alguém entra por uma porta à nossa frente e desviamos o olhar para ver, é então o dedo e o anel que ficam fora de foco.

Isso mostra que a área dentro do espaço em que vivemos, que fica em foco a cada momento é uma área restrita, não a área toda. Podemos nos lembrar por outro lado de algum dia termos subido em uma montanha ou elevação e olhar a paisagem embaixo, seja um vale ou o oceano por exemplo. Tudo ali estará em foco.

Percebemos então que essa área de nitidez é variável, em algumas situações ela é mais extensa, como quando olhamos do alto da montanha, em outras ela é mais restrita, como quando olhamos o anel no dedo.

Se formos recorrer aos estudos da óptica concluiremos que o que está em foco a rigor é apenas o que localiza-se em um plano vertical, paralelo aos nossos olhos e não uma determinada área à frente dos nossos olhos. É como se segurássemos uma folha de papel à nossa frente, à certa distância, não de perfil mas voltada para nossos olhos, de forma que possamos vê-la por inteiro. No momento em que estivermos lendo algo escrito nessa folha, estaremos focalizando a folha em si. Todo ponto localizado nessa folha estará em foco, todo ponto localizado à frente dela estará fora de foco e todo ponto localizado atrás dela - supondo, para viabilizar o exemplo, uma folha de plástico transparente - estará também fora de foco.

Isso é o que queremos dizer quando afirmamos que o foco só existe em um plano vertical à frente de nossos olhos. E agora, o conceito de profundidade de campo.

Quando olhamos para um objeto ou uma pessoa a determinada distância, não só eles mas também outros elementos situados mais à frente, em nossa direção e os situados atrás deles nos parecerão também nítidos, embora não estejam em foco. O que acontece é que nossos olhos não conseguem perceber que esses elementos não estão em foco. Mas elementos situados ainda mais para frente e elementos situados ainda mais para trás, estes sim, estarão, para nós, fora de foco.

Então existe uma faixa dentro da imagem, que se estende um pouco para frente do plano onde está o foco e um pouco para trás, que aparenta aos nossos olhos também estar em foco.

Tudo isso vale para as câmeras fotográficas, assim como para as cinematográficas e as de vídeo: a óptica é a mesma, o processo de formação das imagens é o mesmo. Isso significa que quando apontamos a câmera para um determinado objeto ou pessoa e focalizamos a imagem, o que veremos será o objeto ou pessoa em foco mas também uma área à frente deles e outra atrás onde tudo também nos aparenta estar em foco. Essa área é denominada profundidade de campo. Aqui vale uma distinção: afinal, deve-se dizer "profundidade de campo" ou "profundidade de foco"? Embora os dois termos possam ser às vezes encontrados indistintamente, existe uma aplicação específica para cada um deles. Quando queremos nos referir ao fato de pessoas e objetos aparecerem nítidos ou não em uma determinada região da imagem capturada pela câmera, estamos falando de profundidade de campo.

O termo profundidade de foco é utilizado "do outro lado da câmera", ou seja, para dentro dela. Câmeras profissionais permitem normalmente a troca de objetivas: como seu encaixe é um processo mecânico, podem haver diferenças milimétricas no posicionamento da objetiva em relação à distância até o local onde a imagem é formada. Existe uma área mínima dentro da qual a objetiva pode estar fixada preservando ainda assim o foco. Essa área é a profundidade de foco e existem procedimentos de ajuste nessas câmeras para corrigir o posicionamento do encaixe da objetiva a fim de garantir a precisão na focalização da imagem.

Voltando à profundidade de campo : a área dentro da qual tudo está em foco (como vimos, para nossos olhos) tem extensão variável. Nos exemplos vistos, ela pode ser muito pequena, quando olhamos para o anel ou pode ser muito grande, quando olhamos uma paisagem ao longe. Assim que surgiu a fotografia e depois o cinema, o fato das imagens capturadas possuírem áreas mais nítidas e outras não logo forneceu aos fotógrafos a idéia de utilizar de maneira proposital essa característica, baseando-se em um modo de comportamento de nossas vistas. Frente a um objeto pouco nítido e outro bem nítido, ou uma pessoa, preferimos sempre fixar a vista nos que estão nítidos, é um comportamento natural e esperado do ser humano.

Surge então a linguagem visual apresentando algumas opções para chamar a atenção do expectador, do público que irá ver determinada imagem. A mais óbvia e mais fácil é excluir da área enquadrada o que não queremos mostrar, o que faz por exemplo o close. A mais trabalhada e mais dinâmica é mostrar tudo, mas com diferença de foco: é o que faz o trabalho com a profundidade de campo.

Não é preciso usar um alto nível de desfoque do que não queremos enfatizar, ao contrário, muitas vezes essa área desfocada traz informações de onde se está (campo, cidade, etc...) mas de maneira vaga, sem chamar muito a atenção e sem competir com o elemento principal da imagem, este, perfeitamente em foco. Uma imagem clássica desse efeito em cinema (entre inúmeros outros exemplos) é a do telefone que toca em uma mesa, em primeiro plano, com os atores em segundo plano, estes, em foco. Ao soar o telefone, o foco da câmera é "passado" dos atores para o telefone: o público irá olhar para o telefone. Este recurso é muito utilizado em cinema, pois não é difícil ser construído com a manipulação das objetivas e de alguns controles básicos na câmera.

Entre esses controles, estão a abertura da íris (quanto maior / f-stops pequenos, menor a profundidade de campo) e a distância focal da objetiva (quanto maior / ajuste teleobjetiva, menor a profundidade de campo). Mas é elemento de contribuição primordial também a área onde a imagem é formada, ou seja, seu tamanho. Se analisarmos o tamanho da área onde a quase totalidade das câmeras de vídeo tradicionais forma a imagem (sensor CCD ou CMOS) veremos que ela é muito menor do que a área de um fotograma de filme utilizado em cinema ou fotografia. Esta é a razão de ser difícil obter-se pouca profundidade de campo com câmeras de vídeo, quando deseja-se empregar a linguagem estética do desfoque da imagem, pois tem-se que recorrer somente aos dois elementos abertura / distância focal.

Esse cenário começou no entanto a mudar com 3 tipos de equipamentos distintos: primeiro, as câmeras de cinema digital, empregando sensores de grande tamanho, muitos com a mesma áreas dos fotogramas 35mm. O alto custo de utilização desses equipamentos limitando seu uso a orçamentos maiores levou ao aparecimento de alternativas mais baratas que, embora comprometendo ligeiramente a qualidade da imagem, ainda assim fornecem bons resultados: os adaptadores de lentes 35mm, onde a câmera grava a "imagem da imagem", projetada em um vidro despolido pelas lentes maiores. E, finalmente, surgiu a terceira alternativa, sem comprometimento da imagem mas exigindo determinadas adaptações operacionais, afinal, tratava-se de gravar imagens em movimento com câmeras feitas primordialmente para imagens estáticas, as DSLRs, câmeras digitais capazes de gravar vídeo. O que essas câmeras trazem é da mesma forma a solução do tamanho do sensor, o próprio 35mm (na opção full frame) permitindo também o uso da profundidade de campo limitada a um custo bem inferior ao das câmeras de cinema digital.

Trata-se de mais um passo para aproximar o vídeo do cinema, mestre no uso dos efeitos da profundidade de campo para contar histórias...