é a proporção entre a altura e a largura dos pixels que compõem uma imagem digital. Existem pixels quadrados e pixels retangulares, estes últimos em diversas proporções. Imagens obtidas a partir da captura e digitalização de um sinal de vídeo analógico, imagens obtidas através de scanners e imagens geradas dentro do próprio computador (através de softwares gráficos por exemplo) possuem normalmente pixels quadrados. Imagens obtidas a partir da captura de um sinal de vídeo digital podem possuir pixels quadrados ou retangulares, conforme o formato do vídeo que está sendo utilizado.

O número que indica o valor do pixel aspect ratio é a medida da largura do pixel para uma altura padrão de uma unidade. Assim por exemplo, o formato DV no padrão NTSC possui pixel aspect ratio de 0,9 porque seus pixels possuem 0,9 unidades de largura para uma altura de 1 unidade.

Imagens com mesmo frame aspect ratio, por exemplo 4:3, podem possuir diferentes valores de pixel aspect ratio. Exemplificando: um arquivo de vídeo analógico no padrão NTSC, após ter sido capturado e digitalizado, terá pixels quadrados e a imagem formada por 640 pixels de largura por 480 pixels de altura, ou 648 por 486 (conforme ajustes e tipo da placa de captura). Como os pixels são quadrados, dividindo-se 640 por 480, tem-se 1,3 que é equivalente à proporção 4 / 3, ou seja, tem-se um frame aspect ratio de 4:3. O mesmo vale para a segunda opção (648 x 486).

Um outro arquivo de vídeo, este no formato DV NTSC, após capturado, terá pixels retangulares, na proporção 0,9 e a imagem formada por 720 pixels de largura por 480 pixels de altura. Comparando-se com os arquivos de vídeos acima, tem-se mais pixels de largura (720 contra 640 ou 648); porém, como aqui os pixels são mais estreitos (formato retangular e não quadrados), "cabem" mais pixels por linha e a proporção da imagem continua sendo 4:3, como mostra o cálculo a seguir. Multiplicando-se 720 por 0,9 tem-se 648, que dividido a seguir por 480 resulta em 1,3 que é o mesmo frame aspect ratio 4:3.

Ao contrário do formato DV no padrão NTSC, cujos pixels retangulares são orientados verticalmente (pixels estreitos, "em pé"), no formato DV no padrão PAL os pixels retangulares são orientados horizontalmente (pixels largos, "deitados"). O pixel aspect ratio no DV PAL é 1,0666 ao invés de 0,9 como no DV NTSC. E assim como no DV NTSC, no DV PAL cada linha também possui 720 pixels. Desta forma, sendo os pixels orientados horizontalmente, a imagem aparentemente seria mais larga neste sistema do que no NTSC, por possuir a mesma quantidade de pixels / linha, porém deitados e não em pé. No entanto isto não ocorre, pois o PAL possui um maior número de linhas do que o NTSC (576 ao invés de 480), fazendo com que o frame aspect ratio continue sendo 4:3 . Fazendo-se o cálculo tem-se: 720 multiplicado por 1,0666 = 767,952 que dividido por 576 resulta no mesmo valor 1,3.

A imagem real definida para esses sistemas possui no entanto dimensões ligeiramente diferentes. Na digitalização de uma imagem de vídeo analógica, o processo de sampling emprega para os formatos DV um valor de 25Mbps de bit rate (o chamado DV25). Quanto maior a taxa de amostragem, maior o bit rate (mais informação e consequentemente mais bits são gerados por segundo). Assim, com 25Mbps são conseguidas no sistema NTSC 711 amostras por linha horizontal da imagem, o que é representado por 711 pixels por linha, ou seja, o quadro de imagem tem 711 pixels de largura (e não 720).

Esse valor de bit rate para o formato DV, que resulta em 711 pixels por linha no padrão NTSC, foi definido pelo comitê de radiocomunicação do ITU (International Telecommunication Union) na norma ITU-R BT.601. O comitê decidiu ainda acrescentar pequenas margens à esquerda e à direita desse quadro de imagem, em um total de 9 pixels, totalizando 720 pixels por linha. Essas margens foram acrescidas para prever algumas situações relacionadas com a conversão analógico/digital. Entre essas, eventuais desvios de localização do pulso horizontal de sincronismo (devido a flutuações de timing existentes geralmente nos equipamentos de sinais analógicos como videocassetes), garantia de sincronismo correto permitindo tempo para o sinal analógico a ser digitalizado percorrer os trechos de controle (pulsos horizontal / vertical de sincronismo) e ainda a facilidade de intercâmbio de conteúdo gravado digitalizado, padronizando um mesmo valor a ser utilizado por vários formatos.

No padrão PAL o quadro real de imagem possui 702 pixels de largura, ao invés de 711 como no NTSC. Também aqui, pelos mesmos motivos acima, pixels adicionais (18 no total) foram acrescentados à esquerda e à direita desse quadro.

Assim, tanto no PAL como no NTSC somente a parte mais central do quadro efetivamente corresponde à imagem real vista na tela (parte ativa do quadro). Essas margens além da porção ativa do quadro não são exibidas quando a imagem é mostrada através de monitores / TVs, apesar de fazerem parte do quadro armazenado nos meios digitais (fita Mini-DV, DVD por exemplo).

Somente para o padrão NTSC, ocorre ainda uma outra alteração definida pela norma BT.601: o quadro visível nesse padrão possui 483 linhas, mas as 3 últimas não são utilizadas na digitalização - por isso o valor 480 ao invés de 483 linhas. Essa redução tem por objetivo facilitar o trabalho de compressores de vídeo, como por exemplo os que utilizam o codec MPEG2 (largamente utilizado em DVD-Videos por exemplo). O processo de compressão utilizado por esses algoritmos trabalha com GOPs onde blocos de 16 x 16 pixels são movimentados, e a divisão 480 / 16 resulta em um número exato (assim como o 576 do PAL, ambos são divisíveis por 16).

A figura abaixo ilustra o processo, mostrando as dimensões do quadro de imagem no sistema analógico NTSC, após o processo de sampling, após o armazenamento na fita / disco e como a imagem é exibida na TV. Em monitores não existe a máscara ao redor do tubo de imagem (que cobre uma pequena parcela das margens) mas, ainda assim, normalmente a imagem vista corresponde à parte azul da terceira figura da esquerda para direita abaixo, ou seja, as margens brancas (diferença 711 para 720 pixels) mesmo assim não são mostradas. Na figura, as proporções das margens laterais e das linhas verticais suprimidas durante o sampling foram exageradas para melhor ilustrar o processo:

Apesar do quadro efetivo de imagem (parte azul na terceira figura acima da esquerda para direita) possuir dimensões ligeiramente diferentes do quadro real, devido ao fato desta diferença ser muito pequena (9 e 18 pixels para os padrões NTSC / PAL respectivamente), a alteração no frame aspect ratio é praticamente imperceptível, podendo ser considerada ainda como 4:3, embora, a rigor, como visto, em nenhum desses sistemas digitais as proporções do quadro real da imagem sejam exatamente iguais a 4:3.

Deve-se lembrar também que os pixels exibidos na tela do monitor / TV (CRT, LCD, plasma por exemplo) não guardam relação direta com os pontos coloridos existentes na superfície dos mesmos (para monitores e TVs coloridas), estes são definidos unicamente pela estrutura física da tela - maior ou menor quantidade de pontos por área. Assim, mais de um ponto pode, conforme a situação, estar sendo utilizado para representar o mesmo pixel de imagem.

O uso de pixels quadrados / retangulares por diferentes formatos de vídeo pode acarretar problemas quando suas imagens são exibidas em monitores, conforme o tipo de monitor. Alguns monitores, como os utilizados por computadores, trabalham sempre com pixels quadrados, outros, como TVs por exemplo, trabalham sempre com pixels retangulares. Exibir imagens com pixels retangulares em monitores que trabalham com pixels quadrados causa uma distorção: a imagem ficará com aspecto "esticado" horizontalmente. O inverso produzirá imagens com aspecto "encolhido" horizontalmente.

Na edição-não-linear, os aspectos acima descritos ("esticados" / "encolhidos") podem ocorrer na visualização das imagens, devido às diferenças de exibição de pixels acima citadas. É importante manter o ajuste correto do formato dos pixels durante o projeto. Os softwares de edição no entanto permitem que se estabeleçam ajustes automáticos para tratar estas diferentes situações, devendo ser informado o pixel aspect ratio do vídeo que está sendo editado. Esses valores podem ser alterados após a fase de captura das imagens, no entanto, sempre que a resolução tiver que ser aumentada (mudar de um modo com menos pixels (largura e/ou altura) para um com mais pixels, processo denominado upsample), o software terá que criar pixels intermediários (interpolação) o que fará piorará a qualidade da imagem. O mesmo não ocorre no processo inverso, denominado downsample.

A figura abaixo mostra alguns exemplos de formatos e padrões de vídeo digital após a fase de captura para edição-não-linear:

Os formatos DV widescreen acima correspondem a conteúdos capturados com a câmera utilizando funções que geram imagens anamórficas (widescreen (vídeo)), tanto eletronicamente como através de uma lente especial, sobre o quadro normal de imagem 4:3. Imagens deste tipo, se exibidas no modo normal (4:3), ficarão com aspecto encolhido horizontalmente. Alterando-se o modo para widescreen, cada pixel será mostrado na tela com largura maior: com isso a proporção da imagem aumentará para 16:9 (para visualizá-la por inteiro na tela do monitor do computador, se o mesmo não for do tipo widescreen, a imagem será reduzida para caber dentro do espaço disponível).

Os formatos HDV (HD1 e HD2) possuem quadros de imagem nativamente na proporção 16:9 ao invés de 4:3 como nos formatos DV.