Professional Documents
Culture Documents
ndice
1. Introduccin 2. Desarrollo de H.264 3. Cmo funciona la compresin de vdeo 4. Perfiles y niveles de H.264 5. En qu consisten los fotogramas 6. Mtodos bsicos de reduccin de datos 7. Eficiencia de H.264 8. Conclusiones 3 3 4 5 5 6 7 9
1.
Introduccin
Se espera que el ms reciente estndar de compresin de vdeo, H.264 (tambin denominado MPEG-4 Parte 10/AVC para Codificacin de Vdeo Avanzada) se convierta en el estndar de vdeo a elegir en los prximos aos. H.264 es un estndar abierto con licencia que es compatible con las tcnicas ms eficientes de compresin de vdeo hoy disponibles. Sin comprometer la calidad de la imagen, un codificador H.264 puede reducir el tamao de un archivo de vdeo digital en ms de un 80% si se compara con Motion JPEG, y hasta un 50% comparado con el estndar MPEG-4 Parte 2. Esto significa que se requiere menos ancho de banda y espacio de almacenamiento para los archivos de vdeo. O, visto de otra manera, se puede lograr mayor calidad de imagen de vdeo para una frecuencia de bits determinada. H.264 es un estndar definido de manera conjunta por organizaciones de normalizacin de los sectores de telecomunicaciones e industrias de TI, y se espera que su aceptacin sea ms generalizada que en el caso de estndares anteriores. H.264 ya se ha utilizado en nuevos aparatos electrnicos como telfonos mviles y reproductores de vdeo digital, y ha sido aceptado rpidamente por los usuarios. Los proveedores de servicios como las empresas de almacenamiento de vdeo en lnea o las empresas de telecomunicaciones tambin estn empezando a adoptar H.264. En el sector de la videovigilancia, H.264 encontrar su mayor utilidad en aplicaciones donde se necesiten velocidades y resoluciones altas, como en la vigilancia de autopistas, aeropuertos y casinos, lugares donde por regla general se usa una velocidad de 30/25 (NTSC/PAL) imgenes por segundo. Es aqu donde las ventajas econmicas de un ancho de banda y un almacenamiento reducidos se harn sentir de forma ms clara. Se espera que H.264 acelere tambin la adopcin de cmaras megapxel, ya que con esta eficiente tecnologa de compresin se pueden reducir los archivos de gran tamao y las frecuencias de bits sin que la calidad de la imagen se vea afectada. En cualquier caso, tiene sus exigencias: aunque H.264 permite ahorrar en costes de ancho de banda y almacenamiento, tambin necesita cmaras de red y estaciones de control de mejor rendimiento.
2.
Desarrollo de H.264
H.264 es el resultado de un proyecto conjunto entre el grupo de expertos de codificacin de vdeo de ITU-T y el grupo de expertos de imgenes en movimiento de ISO/IEC (MPEG). ITU-T es el sector que coordina los estndares de telecomunicaciones en nombre de la Unin Internacional de Telecomunicaciones. ISO son las siglas de International Organization for Standardization (Organizacin Internacional de Normalizacin), mientras que IEC son las de International Electrotechnical Commission (Comisin Electrotcnica Internacional), que supervisa los estndares de todas las tecnologas elctricas, electrnicas y afines. H.264 es el nombre usado por ITU-T, mientras que ISO/IEC utiliza el nombre MPEG-4 Parte 10/AVC, ya que lo presenta como parte de su suite MPEG-4. La suite MPEG-4 incluye, por ejemplo, MPEG-4 Parte 2, que es un estndar que ya ha sido usado por codificadores de vdeo basados en IP y cmaras de red. Diseado para solucionar una serie de debilidades de estndares de compresin de vdeo anteriores, H.264 satisface con xito su objetivo de admitir: > > > > > Implementaciones que ofrezcan una reduccin de la frecuencia de bits del 50%, a partir de una calidad de vdeo fija y comparada con otros estndares de vdeo Robustez frente a errores, de forma que se toleren los errores de transmisin a travs de varias redes Capacidades de baja latencia y mejor calidad para latencias mayores Specificacin de sintaxis directa que simplifique las implementaciones Descodificacin de coincidencia exacta, que define exactamente cuntos clculos numricos debe realizar un codificador y un decodificador para evitar que se acumulen errores
H.264 tiene tambin la flexibilidad suficiente como para admitir una amplia gama de aplicaciones con diferentes requisitos de frecuencia de bits. Por ejemplo, en aplicaciones de vdeo de entretenimiento lo que incluye retransmisiones, satlite, cable y DVD H.264 podr ofrecer un rendimiento de entre 1 y 10 Mbit/s con una alta latencia, mientras que en servicios de telecomunicaciones puede ofrecer frecuencias de bits inferiores a 1 Mbit/s con baja latencia.
3.
7,000
Motion JPEG
6,000
5,000
4,000
3,000
2,000
1,000
50 Tiempo(s)
100
Figura 1.
Un codificador H.264 cre hasta un 50% menos bits por segundo para una secuencia de vdeo de muestra que un codificador MPEG-4 con compensacin de movimiento. El codificador H.264 fue al menos tres veces ms eficiente que un codificador MPEG-4 sin compensacin de movimiento y al menos seis veces ms eficiente que Motion JPEG.
4.
5.
Un fotograma P (de interfotograma Predictivo), hace referencia a partes de fotogramas I o P anteriores para codificar el fotograma. Los fotogramas P suelen requerir menos bits que los fotogramas I, pero con la desventaja de ser muy sensibles a la transmisin de errores, debido a la compleja dependencia con fotogramas P o I anteriores. Un fotograma B, o interfotograma Bipredictivo, es un fotograma que hace referencia tanto a fotogramas anteriores como posteriores.
Figura 2.
Secuencia tpica con fotogramas I-, B y P. Un fotograma P slo puede hacer referencia a fotogramas I o P anteriores, mientras que un fotograma B puede hacerlo a fotogramas I o P anteriores o posteriores.
Cuando un decodificador de vdeo restaura un vdeo descodificando la transmisin de bits fotograma a fotograma, la descodificacin debe comenzar siempre por un fotograma I. Los fotogramas P y B, en caso de usarse, deben descodificarse junto a los fotogramas de referencia. En el perfil base de H.264 slo se utilizan fotogramas I y P. Este perfil es el ideal para cmaras de red y codificadores de vdeo, ya que la latencia se reduce gracias a la ausencia de fotogramas B.
6.
Figura 3.
Con el formato Motion JPEG, se codifican y envan las tres imgenes de la secuencia de arriba como imgenes separadas y nicas, (fotogramas I), sin dependencias entre s.
Transmitido
No transmitido
Figura 4.
Con la codificacin diferencial, (la utilizada en la mayor parte de estndares de compresin de vdeo, H.264 incluido), slo se codifica entera la primera imagen (fotograma I). En las dos imgenes siguientes (fotogramas P), existen referencias a la primera imagen en lo que se refiere a elementos estticos, como la casa, mientras que slo se codifican las partes mviles, como el hombre que corre, usando vectores de movimiento y reduciendo as la cantidad de informacin que se enva y almacena.
El grado de codificacin se puede reducir an ms si la codificacin y descodificacin de las diferencias se basa en bloques de pxeles (macrobloques) en vez de en pxeles individuales. La consecuencia es que se comparan reas ms grandes y slo se codifican los bloques que son significativamente distintos. Asimismo, se reduce la sobrecarga asociada a la localizacin de las reas a cambiar. La codificacin diferencial, de cualquier manera, no reducir los datos de forma significativa si hay mucho movimiento en el vdeo. En este caso, pueden utilizarse tcnicas como la compensacin de movimiento basada en bloques. La compensacin de movimiento basada en bloques tiene en cuenta que gran parte de un fotograma nuevo est ya incluido en el fotograma anterior, aunque quizs en un lugar diferente del mismo. Esta tcnica divide un fotograma en una serie de macrobloques. Se puede componer o predecir un nuevo fotograma (por ejemplo, un fotograma P) bloque a bloque, buscando un bloque que coincida en un fotograma de referencia. Si se encuentra una coincidencia, el codificador simplemente codifica la posicin en la que se ha encontrado el bloque que coincide del fotograma de referencia. La codificacin del vector de movimiento, como se denomina, precisa de menos bits que si hubiera de codificarse el contenido real de un bloque.
Ventana de bsqueda Bloque coincidente
Vector de movimiento
Bloque de destino
Fotograma P
7.
Eficiencia de H.264
H.264 lleva la tecnologa de compresin de vdeo a un nuevo nivel. Con H.264 se introduce un nuevo y avanzado esquema de prediccin interna para codificar fotogramas I. Este esquema reduce en gran medida el tamao en bits de un fotograma I y conserva una gran calidad, permitiendo la prediccin sucesiva de bloques de pxeles ms pequeos dentro de un macrobloque de un fotograma. Esto se realiza buscando los pxeles coincidentes entre los pxeles anteriormente codificados que rodean a un nuevo bloque de 4x4
pxeles que se va a codificar internamente. Mediante la reutilizacin de los valores de pxel que ya han sido codificados, se puede reducir drsticamente el tamao en bits. Esta nueva prediccin interna es una parte fundamental de la tecnologa H.264 y ha demostrado ser muy eficiente. A modo de comparacin, si se utilizaran exclusivamente fotogramas I en una transmisin H.264, el tamao del archivo sera mucho menor que si se utilizara una transmisin Motion JPEG, que slo utiliza fotogramas I.
En este modo, los cuatro pxeles inferiores del bloque de arriba se copian verticalmente en parte de un macrobloque codificado internamente. En este modo, los cuatro pxeles de la derecha del bloque de la izquierda se copian horizontalmente en parte un macrobloque codificado internamente. En este modo, los ocho pxeles inferiores de los bloques de arriba se copian diagonalmente en parte de un macrobloque codificado internamente.
Figura 6.
Ilustraciones de algunos de los modos de prediccin interna que pueden tener lugar en la codificacin de 4x4 pxeles dentro de uno de los 16 bloques que forman un macrobloque. Cada uno de los 16 bloques de un macrobloque se pueden codificar usando mtodos distintos.
Imagen original
Imagen de salida
Las imgenes de arriba ilustran la eficiencia del esquema de prediccin interna de H.264, mediante el cual la imagen resultante de la prediccin interna puede enviarse gratis. Slo es necesario codificar el contenido residual y los modos de prediccin interna para crear la imagen de salida.
La compensacin de movimiento basada en bloques (usada para codificar los fotogramas P y B) tambin ha sido mejorada en el estndar H.264. Un codificador puede elegir entre buscar bloques coincidentes (con una precisin inferior a un pxel) en unas pocas o en muchas reas de uno o varios fotogramas de referencia. El tamao y la forma del bloque tambin se puede ajustar para mejorar las coincidencias encontradas. En reas donde no se encuentran bloques coincidentes en un fotograma de referencia, se utilizan macrobloques codificados internamente. El alto grado de flexibilidad de la compensacin de movimiento basada en bloques es til en la vigilancia de escenas abigarradas, manteniendo la calidad en aplicaciones exigentes. La compensacin de movimiento es el aspecto ms exigente de un codificador de vdeo, y las diferentes formas y grados en el que puede implementarlo el codificador H.264 puede afectar a la eficiencia de la compresin del vdeo. Con H.264, los tpicos defectos pixelados (que pueden verse en vdeo muy comprimido usando los estndares Motion JPEG y MPEG en vez de H.264) se pueden reducir usando un filtro de eliminacin de bloques en bucle. Este filtro suaviza los bordes de los bloques con intensidad adaptativa para ofrecer un vdeo descomprimido casi perfecto.
Figura 8.
Los artefactos (defectos) pixelados en la imagen muy comprimida de la izquierda se reducen al aplicar un filtro de eliminacin de bloques, como se muestra en la imagen de la derecha.
8.
Conclusiones
H.264 es un gran paso adelante en la tecnologa de compresin de vdeo, ofrece tcnicas ms eficientes en la compresin gracias a sus mejores capacidades de prediccin y a su capacidad de recuperacin ante errores. Este estndar ofrece nuevas posibilidades a la hora de crear mejores codificadores de vdeo que permiten transmisiones de vdeo de mayor calidad y a mayores resoluciones manteniendo las mismas frecuencias de bits (en comparacin a estndares anteriores), o, a la inversa, la misma calidad e vdeo con frecuencias de bits inferiores. H.264 es el primer proyecto conjunto entre ITU, ISO y IEC para lograr un estndar de compresin de vdeo comn e internacional. Gracias a su flexibilidad, H.264 ya ha sido aplicado en distintas reas como el DVD de alta definicin (como Blu-ray), la difusin de vdeo digital, incluyendo la TV de alta definicin, el almacenamiento de vdeo en lnea (como YouTube), la telefona mvil de tercera generacin y en software como QuickTime, Flash y el sistema operativo de los ordenadores Apple , MacOS X, as como en consolas de videojuegos como PlayStation 3. Con el apoyo de tantas industrias y aplicaciones para consumidores y profesionales, se espera que H.264 sustituya al resto de estndares y mtodos de compresin utilizados en la actualidad. A medida que el formato H.264 sea cada vez ms usado en cmaras de red, codificadores de vdeo y software de gestin de vdeo, los diseadores e integradores de sistemas debern asegurarse de que los productos y proveedores que elijan usen este nuevo estndar abierto. Y hasta el momento, los productos de vdeo en red compatibles con H.264 y Motion JPEG son los ideales para lograr la mayor flexibilidad e integracin posibles.
www.axis.com
31805/ES/R1/0804
2008 Axis Communications AB. AXIS COMMUNICATIONS, AXIS, ETRAX, ARTPEC y VAPIX son marcas comerciales registradas o solicitudes de registro de marca comercial de Axis AB en diferentes jurisdicciones. Todos los dems nombres de empresas, productos y denominaciones sociales son marcas comerciales registradas de su respectivo titular. Nos reservamos el derecho de introducir modificaciones sin previo aviso.