Especificações de codificação para vídeos de música

As funcionalidades descritas neste artigo estão disponíveis apenas para parceiros que utilizam o sistema de correspondência Content ID do YouTube.

Os ficheiros multimédia enviados ao YouTube para vídeos de música têm de estar em conformidade com as seguintes especificações.

Perfil de áudio

Atributo Especificação
Codec FLAC
PCM linear
Taxa de amostragem Taxa recomendada: 44,1 kHz. Aceitamos taxas de amostragem mais elevadas, mas não são necessárias (por exemplo, 48 kHz ou 96 kHz).
Profundidade de bits Profundidade de 24 bits recomendada; profundidade de 16 bits aceitável
Canais 2 (estéreo)

O YouTube aceita áudio comprimido, apesar de não ser recomendado. O YouTube efetua a transcodificação a partir do ficheiro enviado; a qualidade do áudio é bastante superior quando a transcodificação é efetuada a partir de um formato sem perda de dados do que quando é recomprimido um ficheiro de áudio com perda de dados.

Se tiver de enviar áudio comprimido, utilize as seguintes especificações:

  • Codec: AAC-LC
  • Taxa de amostragem: 44,1 kHz
  • Taxa de bits: 320 kbps ou superior para 2 canais (superior é sempre melhor; 256 kbps é aceitável)
  • Canais: 2 (estéreo)
Opção de vídeo 1: Codec H.264

Perfil de vídeo

Atributo Especificação
Contentores .mp4
.mov
Codec H.264
Perfil Elevado
Velocidade de fotogramas 23,98; 24; 25; 29,97; 30
Taxa de bits SD (menos de 720 linhas) – 15 Mbps
720 linhas – 50 Mbps
1080 linhas – 60 Mbps
Resoluções 1,33 (4:3) – 720x480, 1440x1080, 720x576 (PAL)
1,78 (16:9) – 720x404, 720x576 (PAL 16:9), 854x480, 1280x720, 1920x1080
(O conteúdo recortado mais amplo que 1,78 pode adotar outras resoluções. Consulte as notas sobre enquadramento de proporções fora do padrão.)
Formato de píxeis SD: aceitamos píxeis anamórficos (retangulares), mas é necessário definir o formato dos píxeis (pasp) para 16:9 ou 4:3.
HD: apenas píxeis quadrados (não aceitamos conteúdo anamórfico)
Tipo de leitura Progressiva
  O conteúdo com velocidade de fotogramas nativa deve ser desentrelaçado.
  O conteúdo convertido por Telecine deve ser revertido para a velocidade de fotogramas original.


Nota: o conteúdo com fotogramas combinados ou elementos entrelaçados será rejeitado.
Estrutura GOP IBBP (M=3, o comprimento GOP não ultrapassa ½ da velocidade de fotogramas)
Colorimetria 4:2:2 (recomendado)
4:2:0
Enquadramento O formato 16x9 com letterboxing será aceite. Se o conteúdo incluir pillarboxing (pilares pretos à esquerda e à direita), windowboxing (janelas pretas em todos os lados) ou estiver no formato LTBX 4x3, deve recortar o conteúdo até conter apenas a área de píxeis ativa.
Notas Não são permitidas listas de edição, pois provocam perdas de sincronia A/V.
O atom "moov" tem de estar presente, nomeadamente no início do ficheiro.
Opção de vídeo 2: sequência de transporte MPEG-2

Perfil de vídeo

Atributo Especificação
Contentores Sequência de transporte MPEG-2 (.mpg, .mpeg, .ts)
Codec MPEG-2
Perfil SD: Main@Main
HD: 422@High
Velocidade de fotogramas 23,98; 24; 25; 29,97; 30
Taxa de bits SD (menos de 720 linhas): 50 Mbps
HD (720 linhas ou superior): 80 Mbps
Resoluções 1,33 (4:3) – 720x480, 720x576 (apenas PAL), 1440x1080
1,78 (16:9) – 720x404, 720x576 (apenas PAL 16:9 com sinalização anamórfica definida), 854x480, 1280x720, 1920x1080
(O conteúdo recortado mais amplo que 1,78 pode adotar outras resoluções. Consulte as notas sobre enquadramento de proporções fora do padrão.)
Formato de píxeis Apenas píxeis quadrados (não se aceita conteúdo anamórfico).
Tipo de leitura Progressiva
 O conteúdo com velocidade de fotogramas nativa deve ser desentrelaçado.
 O conteúdo convertido por Telecine deve ser revertido para a velocidade de fotogramas original.

Nota: o conteúdo com fotogramas combinados ou elementos entrelaçados será rejeitado.
Estrutura GOP IBBP (M=3, o comprimento GOP não ultrapassa ½ da velocidade de fotogramas)
Colorimetria 4:2:2 (recomendado)
Se a colorimetria 4:2:2 não estiver disponível, utilize 4:2:0.
Enquadramento O formato 16x9 com letterboxing será aceite. Se o conteúdo incluir pillarboxing (pilares pretos à esquerda e à direita), windowboxing (janelas pretas em todos os lados) ou estiver no formato LTBX 4x3, deve recortar o conteúdo até conter apenas a área de píxeis ativa.
A informação foi útil?
Como podemos melhorá-la?