Especificaciones de codificación de vídeos musicales

Solo los partners que utilicen el sistema de coincidencias Content ID de YouTube pueden utilizar las funciones que se describen en este artículo.

Los archivos multimedia de vídeos musicales que subas a YouTube deben cumplir las especificaciones de codificación.

Perfil de audio

Atributo Especificación
Códec FLAC
PCM lineal
Audio PCM en formato de archivo Eclipsa Audio
Frecuencia de muestreo Se recomienda 48 kHz. Se aceptan frecuencias de muestreo más altas (como 96 kHz), pero no son obligatorias.
Profundidad de bits Se recomiendan 24 bits, pero también se aceptan 16 bits
Canales 2 (estéreo)
Hasta 18 canales y hasta 2 elementos de audio (Eclipsa Audio)
  • Un solo elemento de audio puede basarse en un canal o en una escena

Aunque no lo recomendamos, aceptamos audio comprimido. YouTube transcodifica a partir del formato proporcionado; la calidad del audio es mucho mejor cuando se transcodifica a partir de un formato sin pérdidas, en comparación con volver a comprimir un formato de audio con pérdidas.

Si tienes que proporcionar audio comprimido, usa estas especificaciones:

  • Códec: AAC-LC, Opus o Eclipsa Audio
  • Frecuencia de muestreo: 48 kHz
  • Tasa de bits: 320 kbps o superior para 2 canales (cuanto más alta, mejor; se aceptan 256 kbps), 128 kbps por canal para Eclipsa Audio
  • Canales: 2 (estéreo), hasta 18 canales para Eclipsa Audio
Opción de vídeo n.º 1: códec H.264

Perfil de vídeo

Atributo Especificación
Contenedores .mp4
.mov
Códec H.264
Perfil Alto
Velocidad de fotogramas 23,98; 24; 25; 29,97; 30
Tasa de bits SD (menos de 720 líneas): 15 Mbps
720 líneas: 50 Mbps
1080 líneas: 60 Mbps
Resoluciones 1.33 (4:3): 720x480, 1440x1080, 720x576 (PAL)
1.78 (16:9): 720x404, 720x576 (PAL 16:9), 854x480, 1280x720, 1920x1080
El contenido recortado con una anchura superior a 1.78 puede no seguir estas resoluciones. Consulta las notas sobre cómo deben enmarcarse los vídeos con relaciones de aspecto no estándar.
Relación de aspecto en píxeles SD: se aceptarán píxeles anamórficos (no cuadrados), pero la marca de relación de aspecto de los píxeles (pasp) se debe definir como 16:9 o 4:3.
HD: solo píxeles cuadrados (sin contenido anamórfico).
Tipo de escaneo

Progresivo
Es necesario deshacer el entrelazado del contenido que tenga una velocidad de fotogramas nativa.
Se debe aplicar un proceso de telecine inverso al contenido de telecine hasta alcanzar la velocidad de fotogramas original.


Nota: Se rechazará el contenido que incluya fotogramas combinados o artefactos entrelazados.

Estructura GOP IBBP (M = 3, la longitud del GOP no debe superar la mitad de la velocidad de fotogramas)
Espacio de color 4:2:2 (preferida)
4:2:0
Enmarcado Se aceptarán fotogramas con una relación de aspecto de 16:9 y efecto panorámico. Si el contenido tiene efecto vertical (franjas negras a la derecha y a la izquierda), windowboxing (franjas negras en todos los laterales) o una relación de aspecto de 4:3 o 1.43:1 con efecto panorámico, deberás recortarlo de forma que solo se vea el área de píxeles activa.
Notas No se pueden usar listas de edición porque desincronizan el audio y el vídeo.
Debe estar presente el parámetro Atom moov al principio del archivo.
Opción de vídeo n.º 2: secuencia de transporte MPEG‐2

Perfil de vídeo

Atributo Especificación
Contenedores MPEG-2 Transport Stream (.mpg, .mpeg, .ts)
Códec MPEG-2
Perfil SD: Main@Main
HD: 422@High
Velocidad de fotogramas 23,98; 24; 25; 29,97; 30
Frecuencia de bits SD (menos de 720 líneas): 50 Mbps
HD (720 líneas o más): 80 Mbps
Resoluciones 1,33 (4:3): 720x480, 720x576 (solo para PAL), 1440x1080
1,78 (16:9): 720x404, 720x576 (PAL 16:9 solo con un conjunto de marcas anamórficas), 854x480, 1280x720, 1920x1080
El contenido recortado con una anchura superior a 1,78 puede no seguir estas resoluciones. Consulta las notas sobre cómo deben enmarcarse los vídeos con proporciones no estándar.
Proporción en píxeles Solo píxeles cuadrados (sin contenido anamórfico).
Tipo de escaneo Progresivo
 Es necesario deshacer el entrelazado del contenido con velocidad de fotogramas nativa.
 Se debe aplicar un proceso de telecine inverso al contenido de telecine hasta alcanzar la velocidad de fotogramas original.

Nota: Se rechazará el contenido que incluya fotogramas combinados o artefactos entrelazados.
Estructura GOP IBBP (M=3, la longitud del GOP no debe superar la mitad de la velocidad de fotogramas)
Espacio de color 4:2:2 (preferido)
Si el espacio de color 4:2:2 no está disponible, usa 4:2:0.
Enmarcado Se aceptarán fotogramas con una proporción de 16:9 y formato de letterboxing (panorámico). Si el contenido tiene formato de pillarboxing (franjas negras a la derecha y a la izquierda), windowboxing (franjas negras en todos los laterales) o tiene una proporción de 4:3 con formato de letterboxing, deberás recortarlo de forma que solo se vea el área de píxeles activa.

¿Te ha resultado útil esta información?

¿Cómo podemos mejorar esta página?
Búsqueda
Borrar búsqueda
Cerrar búsqueda
Aplicaciones de Google
Menú principal
6059044245669882197
true
Buscar en el Centro de ayuda
false
true
true
true
true
true
59
false
false
false
false