(gamma encoding, gamma compression) processo de ajuste eletrônico da curva de sensibilidade do sinal de vídeo lido dos sensores de imagem CCD /CMOS. Seu objetivo é codificar a intensidade da luminosidade na imagem obtida pela câmera de forma a coincidir com a maneira como o olho humano enxerga imagens de maneira geral e, além disso, para obter o melhor resultado utilizando um número limitado de bits. O estudo de gamma correction envolve conceitos de diferentes áreas do conhecimento humano: Percepção visual, Física, Fotografia e Vídeo.

No processo de geração de um sinal de vídeo através dos sensores CCD/CMOS, quanto maior a quantidade de luz recebida por um determinado pixel , mais intensa a corrente elétrica gerada (efeito fotoelétrico na superfície foto-sensível do pixel) e portanto maior a carga acumulada nos acumuladores individuais associados a cada pixel. Ao ser feita a leitura de uma determinada linha de pixels, será possível associar intensidade da voltagem lida do acumulador com luminosidade de cada pixel. Em outras palavras, quanto maior a luminosidade maior será a corrente gerada. Essa relação no sensor é diretamente proporcional, como mostra o desenho (gráfico em forma de reta):

No entanto, o registro do olho humano para a mesma cena é diferente, como mostra o gráfico abaixo:

O olho humano percebe a luminosidade de maneira não uniforme, principalmente na faixa intermediária de tonalidades (meios-tons), acentuando seus valores. Observando o gráfico acima, para uma intensidade média de determinada imagem vista pelo olho humano e também vista pela câmera, a percepção para o olho é maior do que o sinal gerado no sensor. O registro feito pelo sensor portanto é mais escuro (ou menos luminoso) de maneira geral do que o feito pelo olho humano.

Por outro lado, os dispositivos do tipo CRT não conseguem mostrar as imagens da forma como foram capturadas pelo sensor: à medida que o sinal aumenta, o brilho na tela não aumenta na mesma proporção, de forma linear (gráfico em forma de reta) e sim através de um gráfico em forma de curva. Este fato não tem relação com a superfície interna recoberta de fósforo do tubo de imagem CRT e sim com características próprias do canhão de elétrons no interior do tubo (interação eletrostática entre o cátodo e a tela que controla o facho de elétrons). O gráfico abaixo mostra a curva não-linear no gráfico que relaciona sinal e brilho na tela em um CRT:

Portanto a imagem obtida pela câmera seria mostrada da seguinte forma pelo CRT (mais escura do que deveria):

essa curva de reprodução de imagem do CRT é descrita através da equação:

onde γ (gamma) é o expoente, cujo valor, constante, aproxima-se muito de 2,5. Como o expoente é constante e a base é que varia, essa função denomina-se função potencial (ao contrário das funções exponenciais, onde quem varia é o expoente e não a base).O gráfico abaixo mostra a curva, que tornou-se conhecida como curva de gamma, levando o nome do expoente da equação que a determina:

O valor 0,7 por exemplo, de intensidade de sinal, quando elevado ao expoente2,5 resulta em 0,4099 na escala de intensidade luminosa, o que é mostrado nográfico através das retas verdes. Se a resposta do sinal efetuada pelo CRT fosselinear, o valor de intensidade luminosa nesse ponto também seria de 0,7. Paracompensar esse desvio, o sinal lido do sensor é modificado ainda na câmera,antes ou após passar pelos processos de amostragem, digitalização e compressão(conforme o equipamento, podendo ocorrer ajustes também nas duas fases), em um processo denominado gamma correction. Essa modificação compensa o modo de exibição do CRT reforçando o sinal de maneira contrária, ou seja, a curva que descreve a voltagem gerada no sensor é alterada como:

o efeito dessa compensação é que as duas curvas somam-se (sinal alterado e forma de reprodução do CRT) e o resultado é o desaparecimento da não-linearidade no CRT: a sua exibição de luminosidade torna-se uniforme, linear, como mostra o desenho abaixo:

essa curva é descrita através da equação:

onde o expoente é exatamente o inverso do expoente gamma (g) da curva anterior: 1/g. Como seu valor gira em torno de 2,5, o expoente = 1/2,5. As duas curvas são uma o inverso da outra, como mostra o gráfico abaixo:

o processo todo pode ser visualizado no gráfico abaixo:

com o processo de gamma correction a câmera mimetiza a forma de enxergar do olho humano. A correção é necessária por 2 aspectos: físico e perceptual. Físico, para compensar a não-linearidade do CRT na obtenção da reprodução correta das intensidades dos diversos trechos da imagem. Perceptual, por dois motivos: minimizar a visibilidade de "ruídos" na imagem (quando a TV surgiu, percebeu-se que o sinal, se transmitido na forma não-linear ajudava a minimizar a visualização dos "ruídos" na imagem involuntariamente surgidos durante o processo de transmissão) e conseguir representar imagens utilizando um número restrito de bits após o processo de digitalização. Esses ruídos são mais visíveis na faixa de tonalidades mais escuras da imagem, conforme visto adiante.

Se o sinal permanece na forma linear, para cada variação de unidade de intensidade de sinal corresponde, como visto acima, uma determinada intensidade de luminosidade. No entanto, o olho humano não percebe diferenciação entre vários desses pontos na escala superior da reta. Por outro lado, percebe exageradamente na escala inferior, o que deve ser evitado. Tem-se então trechos com dados armazenados inutilmente - ocupando espaço na banda de transmissão. Quando o sinal é representado na forma curva mostrada acima, essas áreas, principalmente as de baixa luminosidade (baixas luzes) e alta luminosidade (altas luzes) ficam comprimidas, exigindo menos intervalos no eixo horizontal do gráfico para serem representadas. Isso significa que a mesma imagem pode ser representada através de um número menor de variações na intensidade do sinal, o que se traduz por um número menor de bits após a digitalização. Por outro lado este processo é responsável pela falta de maior latitude do vídeo em relação à película fotográfica / cinematográfica.

Pode-se por exemplo imaginar um gráfico relacionando voltagem (no eixo horizontal) com intensidade luminosa (no eixo vertical): conforme visto acima, no sinal gerado pelo sensor este gráfico é linear (reta). Supondo-se que se queira representar um intervalo de 255 variações de intensidade, serão necessários 8 bits para tal, pois o maior número que pode ser representado nesse sistema de numeração, com 8 bits, é 255 (11111111 em binário). Nessa representação, o código "0" significaria preto absoluto, e o valor "255" o branco absoluto (trata-se de luminosidade, não estão sendo empregadas cores aqui). Conforme Charles Poynton em seu livro A Technical Introduction to Digital Video, cap. 6, nessa escala o código "100" representaria uma determinada tonalidade de cinza claro que seria o limite da percepção do olho humano em termos de diferenças de intensidade de cor. Para valores acima de "100", a taxa de variação de intensidade luminosa entre uma determinada tonalidade e a seguinte estaria abaixo de 1% e para valores abaixo de "100" esta variação estaria acima de 1%.

No caso de valores abaixo de "100", à medida que percorremos a escala em direção ao "0" (preto absoluto), poderemos notar um aumento gradativo na diferença de tonalidade entre uma escolhida ao acaso e sua vizinha. Na posição do código "25" esta diferença é da ordem de 4%, ou seja, existe nesse trecho falta de suavidade entre um "degrau" e outro de tonalidade, sendo as diferenças mais marcantes. Esse fato traduziria-se por defeitos ("ruídos") nas partes escuras das imagens, especialmente nas que apresentassem trechos onde a luminosidade variasse muito suavemente. Ao invés de uma variação suave, percebem-se as faixas de variação de tonalidade, defeito conhecido como banding ou contouring.

No caso de valores acima de "100", não existem os "ruídos" acima descritos. No entanto, à medida que percorremos a escala em direção ao "255" (branco absoluto), cada vez diminui mais a percepção do olho humano em relação às variações de luminosidade. Na posição de código "200" a diferença de tonalidade entre ela e a seguinte é da ordem de 0,5%, muito acima do limite para o qual o olho consegue perceber alguma diferença (1%). Dessa forma, uma faixa qualquer nesse trecho, por exemplo de "180" a "210" poderia ser representada por um único valor, o mesmo, ao invés de valores individuais e o olho nada perceberia com isso.

Ainda, conforme Poynton, para compor um conjunto homogêneo de graduação de intensidades, variando suavemente do preto absoluto ao branco absoluto sem que se perceba os diversos degraus nesse intervalo, é preciso, como visto acima, que a diferença entre um degrau e seu vizinho seja menor do que 1% do total de intensidade luminosa (referência branco absoluto). Desta forma, acrescentando-se pouco a pouco intervalos cada vez mais claros em 0,01 de variação de intensidade luminosa (1%), a partir do preto absoluto, até a posição 100 (porque a partir desta posição não se distinguem mais variações, como visto acima), tem-se 100/0,01 = 10.000. Esse número, convertido para o sistema binário ocupa 14bits. No entanto, utilizando a forma não-linear de representação (curva da função potencial vista acima), é possível representar a mesma imagem, com a mesma perceptibilidade para o olho humano usando em torno de 460 códigos diferentes ao invés dos 10.000 acima. Para representar esse intervalo, bastam os 8 bits citados.

Isso mostra que a representação linear de uma imagem não é uma técnica otimizada, ao dispender desnecessariamente informações inutilmente armazenadas e transmitidas. Com o limite de percepção do olho humano situado na faixa de 1%, basta reter, de toda a informação contida na escala 0-255, apenas aqueles valores situados acima desse valor. Além disso, é recomendável diminuir a quantidade de variações nas tonalidades próximas do preto absoluto, por questões de ruídos na imagem, como visto acima.

E a representação que melhor traduz essa modificação no sinal de vídeo é a curva da função potencial (curva "virada para baixo", onde o expoente gamma tem valor 1/2,5). Por este motivo é uma feliz coincidência a curva de representação do CRT ser muito aproximadamente o inverso desta curva, exigindo, para correção, a codificação do sinal de vídeo desta forma.

Na realidade no entanto, é empregada uma pequena variação nesse valor de expoente: percebeu-se que com a correção de gamma ajustada para 1/2,5 em ambientes claros a imagem do televisor apresentava-se bem nítida, com contraste e luminosidade corretos. No entanto, em ambientes ligeiramente escurecidos a imagem do televisor era percebida pelo olho humano como tendo pouco contraste. A causa deste problema é um fenômeno denominado surround effect , exemplificado pelo desenho abaixo:

Conforme demonstrado pelos pesquisadores DeMarsh e Giorgianni, entre os diversos mecanismos de adaptação empregados pelo olho humano, um deles consiste em aumentar a sensibidade a pequenas variações de luminosidade, quando esses trechos na imagem estão cercados (daí o nome surround) por outros trechos também claros. O fato de toda a imagem ser mais clara reduziria o contraste total da mesma, incluindo o da área de interesse na imagem. Para compensar este fato, o olho aumentaria o contraste da área de interesse. De maneira inversa, quando a área de interesse é circundada por trechos escuros, todo o contraste geral da imagem aumentaria, e para compensar, o olho diminuiria o contraste da área de interesse.

Na figura acima, os 3 quadrados centrais possuem exatamente a mesma luminosidade, mas na parte superior da figura o contraste entre eles aparenta ser maior do que na parte inferior, especialmente quando se observa o quadrado preto mais à esquerda. Este fenômeno foi notado primeiro no processo de revelação de películas fotográficas para confecção de slides para projeção. Utilizando o mesmo ajuste de obtenção de nível de contraste no filme, a cópia impressa de determinada fotografia apresentava-se com bom contraste. No entanto, na versão slide da mesma foto, a projeção apresentava falta de contraste, devido ao fenômeno surround effect. Para compensá-lo, o processo de revelação de negativos para confecção de slides (diapositivos) passou a empregar uma taxa maior de contraste nas imagens.

O mesmo aconteceu com a TV) : como na maioria das situações a TV é vista em salas / ambientes com pouca luz, convencionou-se distorcer a curva de correção de gamma para gerar mais contraste, diminuindo-se o valor do expoente, no sistema NTSC , de 1/2,5 para 1/2,2. Isso faz com que a curva de correção torne-se ligeiramente mais "esticada", como mostra o gráfico abaixo:

Quanto mais "vertical" a curva, maior é o contraste, pois para muitas variações de intensidade de sinal existirão poucas variações de luminosidade. A figura abaixo se propõe a mostrar isso modificando a forma da curva de gamma. Na figura da esquerda a curva foi alterada para aproximar-se da posição vertical: com isso, um pequeno valor de deslocamento no eixo da intensidade de sinal (eixo "x") corresponde a um grande deslocamento no eixo das intensidades (eixo "y"). A imagem ganhou mais contraste quando comparada com a imagem original, ao centro. Esta, por sua vez, corresponde à posição normal da curva, inalterada. Já na imagem mais á direita, a curva foi inclinada no sentido horizontal e o inverso passou a ocorrer: a um determinado valor de deslocamento no eixo "x" corresponde um pequeno valor de deslocamento no eixo "y", ou seja, a luminosidade não altera muito ou, em outras palavras, a imagem perde bastante contraste, ficando com o aspecto dito "lavada".

Na realidade essas modificações, ilustradas através de um gráfico do tipo reta, funcionam da mesma maneira para ajustes efetuados na curva real de gamma: se determinado trecho dela for inclinado em direção á posição vertical, haverá maior variação de luminosidade nesse trecho (maior contraste). Por outro lado, se for inclinada em direção à posição horizontal, o trecho perderá contraste.

A correção de gamma foi estabelecida em função dos televisores disponíveis à época, todos do tipo CRT. Nos anos recentes novas tecnologias surgiram, como LCD , plasma , OLED e outras. Estes equipamentos fazem ajustes internos no sinal recebido, não necessariamente como os CRTs fazem, mas de forma a poderem dentro de suas características específicas, utilizando o mesmo sinal, exibir imagens da melhor forma possível.

Um outro pequeno ajuste também é acrescentado na curva: sua parte inicial, correspondente às luzes baixas (trecho próximo do preto absoluto) é tornada reta, para minimizar a presença comum de ruídos de imagem nessas áreas, devido às características dos sensores empregados. O gráfico abaixo mostra esse trecho:

Assim, a correção de gamma não é simplesmente a inversão simples da curva de resposta do CRT: além dessa inversão, duas correções adicionais são acrescentadas, o ajuste na parte inicial acima descrito e o deslocamento do expoente devido ao surround effect também acima descrito.

A correção de gamma foi colocada, com o desenvolvimento das transmissões de TV, no momento da geração das imagens, mais especificamente dentro das câmeras, por uma questão econômica: ou ela seria feita dentro dos televisores (CRTs) ou dentro das câmeras. No entanto, efetuar esta correção nos televisores implicaria em acrescentar circuitos às mesmas, uma questão mais fácil de ser resolvida em termos de custo x benefício dentro das próprias câmeras.

Dentro da câmera, o ajuste é efetuado na fase de captura das imagens, através de um circuito denominado DSP - Digital Signal Processor, que atua após o sinal ter sido digitalizado, na sua forma digital componente.

A principal função do DSP é a correção de gamma, mas câmeras mais elaboradas oferecem a possibilidade de efetuar ajustes adicionais nessa curva após a correção básica ter sido feita. Estas alterações normalmente são pré-determinadas de fábrica e cada uma delas acarreta um look ligeiramente diferente na imagem, ora acentuando o contraste, ora o diminuindo, ora fazendo alterações somente nas áreas mais claras, ou mais escuras, etc... A figura abaixo mostra as curvas de gamma disponíveis para seleção na câmera Panasonic AG-DVX100B:

A figura abaixo, mostra o mesmo tipo de curvas, para a câmera Sony PMW-EX1:

Conforme foi dito, quanto mais vertical o trecho da curva, maior o intervalo de tonalidades diferentes (latitude) perceptível para o olho humano abrangido e portanto maior o contraste. Quanto mais horizontal determinado trecho da curva for, menor o intervalo de tonalidades abrangido e menor o contraste.

É possível efetuar um ajuste somente na parte superior da curva, região das partes mais claras da imagem (altas luzes). Essa região no gráfico é denominada knee e seu ajuste permite distorcer a curva para baixo somente nesse trecho, causando um "achatamento" na variação de tonalidades claras.

A correção pode atuar somente na luminância (câmeras P&B) ou sobre os sinais RGB (câmeras coloridas atuais); neste caso, cada um dos 3 sinais RGB tem sua própria curva de gamma. Geralmente os ajustes disponibilizados nas câmeras para gamma atuam conjuntamente sobre os 3 sinais.

Os ajustes de gamma levam em conta a exibição correta no monitor: a curva supõe o ajuste de brilho do mesmo na sua posição média. Aumentar ou diminuir o ajuste no botão do brilho (ou controle equivalente, via menu) desloca a curva de gamma para cima ou para baixo, alterando o seu expoente. Trata-se desta forma de acrescentar desvios à esquerda ou à direita, para além da correção efetuada pelo sistema câmera / monitor.

Em fotografia com película (idem cinema) a curva de gamma também é empregada para medir o contraste, no caso, construída através de uma fórmula cujo resultado é uma curva muitas vezes representada, de acordo com o significado disposto em seus eixos, através de um formato que lembra ligeiramente um "S" esticado ou o contorno descendente de um dos lados de uma montanha. Porém, é uma curva análoga à da fórmula de função potencial vista aqui. Essas curvas, em fotografia e cinematografia são chamadas curvas H&D porque foram descritas pela primeira vez por Ferdinand Hurter e Vero C. Driffield. Os trechos próximos do branco absoluto e do preto absoluto são comprimidos, e a parte central da curva aproxima-se de uma reta. Essa parte central, retilínea, é descrita por uma função potencial e seu expoente também recebe o nome de gamma. O vídeo herdou esse termo dessas curvas.

Câmeras recentes efetuam um trabalho muito preciso sobre a curva de gamma: ao invés de utilizar um expoente único para a curva toda, como mostrado aqui, a curva é dividida em diversos segmentos e um ajuste acurado é feito para cada um deles. Existe também a possibilidade do controle individual de cada curva por canal RGB, aumentando ainda mais a qualidade da correção e ajuste da imagem.

Além do nome gamma correction, o termo gamma encoding também é empregado, porque a imagem é codificada, a partir de seu original, em uma forma diferente, como visto. E também o termo gamma compression, em referência à diminuição dos valores de variações de tonalidade em função da percepção do olho humano e de questões técnicas relacionadas à economia de espaço e à compatibilidade com o modo de reprodução dos monitores, como o CRT por exemplo. Analogamente, o modo de exibição de imagens efetuado pelo CRT (curva para baixo) recebe também os nomes gamma nonlinearity, decoding gamma e gamma expansion.

Ajustes de gamma também são encontrados em computação, para exibição de gráficos e imagens.