You are on page 1of 5

TEMA 4

1. HISTORIA DE LOS ESTNDARES


SMPTE (VC-1 WMV9), ITU (H.264), ISO (MPEG)
1 patente: 25 de abril de 1929 (Ray Davis Kell)
ITU+ISO Joint Video Team H.264 / MPEG-4 AVC (2003-2006)
A de 35 dB PSNR Bit-rate Reduction: 75%
A mismo bit-rate reduction 100kbit/s Casi 10 dB ms de PSNR
MPEG-4 = Mltiples estndares (partes) parte 2 (visual, cdec de compresin para
elementos visuales) parte 10 (Advanced Video Coding, cdec de vdeo como el H.264)
2. MPEG-4 PARTE 10: AVC/H.264
Denominacin: H.264/MPEG4 AVC
Objetivos: Tecnologa ncleo para todo tipo de aplicaciones, duplicar la compresin
mejorando la tcnica (ms tasa binaria, misma calidad), mejoras en compresin (ms
complejidad) y calidad de compresin (segn el contenido y la aplicacin).
Aplicaciones: Broadcast (DSL, satlite), Almacenaje (DVD), Servicios convencionales (ISDN,
LAN), vdeo bajo demanda o streaming (ISDN, DSL), MMS (sobre ISDN, Ethernet), etc.
Caractersticas de diseo:
- Prediccin: compensacin de movimiento (ms flexible, tamao de bloque variable,
hasta 4x4, precisin de cuarto de pxel, mltiples referencias), vectores de movimiento
hacia fuera de la imagen, orden de referencia distinto de visualizacin, prediccin
ponderada, prediccin para Intra, filtrado en buble de desbloqueo.
- Codificacin: transformacin con enteros, transformada de bloques pequeos 4x4,
transformada de bloques jerrquicos, transformada con palabras cortas, codificacin
entropa aritmtica (CABAC), codificacin entropa adaptativa al contexto
(CAVLC/CABAC).
- Resistencia a errores: estructura de parmetros, NAL (estructura sintctica), tamao
de slice flexible, FMO (orden flexible de MB), ASO (orden arbitrario de slices),
imgenes redundantes, particionado de datos, cuadros SP/SI para sincronizacin o
cambio de flujos binarios.
Perfiles principales:

Perfiles de extensin FREXT


Perfiles de codificacin escalable (SVC scale video coding):
-

Scalable Baseline Profile (apps de videoconferencias y mviles)


Scalable High Profile (broadcast, streaming, almacenaje)
Scalable High Intra Profile (produccin)

Escalabilidad: se quita parte del flujo binario (obteniendo menos calidad que el original). Hay
flujos escalables (multi-layer bit streams) y no escalables (single-layer bit streams).
Tipos de escalabilidad: Temporal (transmitir menos cuadros, peor resolucin de movimiento),
Espacial (imagen ms pequea), y de calidad PSNR- (mismo tamao peor calidad).
Ventaja: multidifusin (multicast), clientes heterogneos (se ofrece contenido de diferente
tamao, tasa binaria y de cuadros segn) y proteccin de error diferente segn importancia.
Esquema:

Proceso de codificacin por MB:

Tamao MB variable: Luma (16x16, 16x8, 8x16, 8x8, 8x4, 4x8, 4x4) Croma (8x8, 8x4, 4x8, 4x4)
Ventajas: mejor adaptacin a la imagen, coeficientes ptimos, codificacin eficiente,
referenciado ms complejo y vectores ms fieles.
SLICES
Slices (conjunto de MBs): Asignados en orden de lectura, codificados independientemente.
Slice group (conjunto de slices definidos por un mapa de colocacin.
En MPEG-4 estructura flexible: tamaos flexible, orden de MB flexible FMO (no tiene porque
acabar el slice al borde derecho, se pueden agrupar slices, aumenta la robustez en cuanto a
perdidas de datos), orden de slices arbitraria ASO.
Tipos de slices:

Estructura:

FMO: Tipos de mapas de colocacin en slices 6 fijos y uno aleatorio, determinan el slice group):
Tipo0 (tiras que no tienen por qu acabar en borde), Tipo1 (maths), Tipo2 (rectngulos de
inters) Tipo3-5 (dinmicos, cambian de forma).
Aplicaciones: ms robustez para errores de transmisin (eyes censored ajedrez),
codificacin de regiones de inters
Procesado entrelazado: Codificacin adaptativa cuadro/campo. En cuadros entrelazados
menor dependencia estadstica entre filas con objetos movidos puede ser ms eficiente
codificar individualmente cada campo.
Posible codificacin: Field Coding (campo), Frame coding 1 (cuadro), Frame coding 2 (escner
de cuadro por parejas de MBs decidiendo codificacin: MBAFF adaptative frame/field).
Prediccin Intra: prediccin espacial (segn pxeles adyacentes ya transmitidos), codificar la
diferencia. Modos: 4 (vertical, horizontal, DC y plano) para bloques de croma y MB 16x16 y 9
(DC y 8 direccional) para bloques 4x4 y 8x8. Clculo SAD con todos los modos y el que menor
SAD tenga. Para luma Intra16x16 para zona suave y Intra4x4 para los detalles.

Prediccin de cuadros P y B:
Fixed Size Block-Matching y Variable Size Block-Matching.
N de vectores de movimiento posibles entre 1 y 16.
Precisin de cuarto de pixel de la distancia entre muestras de luma Qpel.
Movimiento a precisin sub-pxel: interpolacin (costoso) o algoritmo en varios pasos (de
grueso a fino: estimacin con precisin entera, refinamiento alrededor del punto y ajuste a
medio pxel y refinamiento alrededor del punto para ajuste a cuarto de pxel).
Proceso de interpolacin de las muestras intermedias:
A medio pxel filtro FIR de grado 6 (1,-5,20-20,-5,1) contempla ms la textura.
A cuatro de pixel: promedio de las muestras ms prximas en posiciones enteros o medias
(interpolacin bilineal).

Referencias:
P: se pueden utilizar ms de una imagen de referencia que son guardadas en una lista 0 y
pueden ser imgenes futuras o pasadas pero transmitidas. Cada MB P puede tener su
referencia en otro cuadro.
B: se pueden utilizar una o dos imgenes de referencia (ya transmitidas) para cada MB en dos
listas ponderando valores. Cada MB B puede tener dos referencias en otros cuadros. Adems
las imgenes B puede ser referencia para compensacin de movimiento.

Cuadro B generalizado: para cada regin de imagen cualquier pareja de imgenes de


referencia. B slices se basan en promedio ponderado de dos referencias diferentes. 4 tipos de
prediccin inter, segn lista 0, segn lista 1, segn el promedio (bi-predictive) o prediccin
directa (deducida), tambin puede saltar.
Transformacin entera:
En intra doble transformacin para DC.
Ventaja de transformaciones de tamaos pequeos: prediccin mejorada, menos ruido de
bordes y menos costes computacional.
Filtro Anti-bloques: en el bucle de prediccin
Mejora la calidad objetiva y subjetiva de la imagen decodificada. Hace un filtrado adaptativo al
contenido (quita efectos de bloque sin desenfocar).
Codificacin entrpica
CAVLC (Context Adaptative Variable Length Coding) se adapta al contenido de la imagen +25%
de huffman. CABAC (Context Adaptative Binary Arithmetic Coding) mucha compresin +10%
de CAVLC, adapta al contenido dinmicamente durante la codificacin, slo funciona para
datos binarios
CABAC: Mapeo de smbolos a bits eleccin de modelo estadstico segn observaciones
pasadas aplicacin del modelo para la codificacin actual y la del modelo.

You might also like