reproductor que h264 formato descargar algorithm video compression video-streaming mpeg

algorithm - que - ¿Cómo funciona la compresión MPEG4?



h264 mp4 (4)

Al igual que cualquier otro códec de video popular, MPEG4 utiliza una variación de la transformada de coseno discreta y una variedad de técnicas de compensación de movimiento (que pueden considerarse como predicción de movimiento si eso ayuda) que reducen la cantidad de datos necesarios para los cuadros subsiguientes. Esta página tiene una descripción general de lo que se hace mediante MPEG4 simple.

No es totalmente diferente a las técnicas utilizadas por JPEG.

¿Alguien puede explicar de forma simple y sencilla cómo funciona MPEG4 para comprimir datos? Estoy interesado principalmente en el video. Sé que hay diferentes normas o partes de ella. Solo estoy buscando el método de compresión general predominante, si hay uno con MPEG4.


Los bordes afilados ciertamente contienen altas frecuencias. Reducir o eliminar las altas frecuencias reduce la nitidez de los bordes. Los detalles finos, incluidos los bordes afilados, se eliminan con la eliminación de alta frecuencia; la habilidad de resolver 2 objetos pequeños se elimina con altas frecuencias; luego verá solo uno.


MPEG-4 es un estándar enorme, y emplea muchas técnicas para lograr las altas tasas de compresión que es capaz de lograr.

En general, la compresión de video se ocupa de tirar la mayor cantidad de información posible y, al mismo tiempo, tiene un efecto mínimo en la experiencia visual para un usuario final. Por ejemplo, el uso de YUV en submuestreo en lugar de RGB reduce el tamaño del video a la mitad inmediatamente. Esto es posible ya que el ojo humano es menos sensible al color que al brillo. En YUV, el valor de Y es el brillo, y los valores de U y V representan el color. Por lo tanto, puede eliminar parte de la información de color que reduce el tamaño del archivo, sin que el espectador note ninguna diferencia.

Después de eso, la mayoría de las técnicas de compresión aprovechan 2 redundancias en particular. El primero es la redundancia temporal y el segundo es la redundancia espacial.

La redundancia temporal señala que los cuadros sucesivos en una secuencia de video son muy similares. Típicamente, un video sería del orden de 20-30 cuadros por segundo, y nada cambia mucho en 1/30 de segundo. Tome cualquier DVD y deténgalo, luego muévalo en un cuadro y observe cuán similares son las 2 imágenes. Por lo tanto, en lugar de codificar cada fotograma de forma independiente, MPEG-4 (y otros estándares de compresión) solo codifican la diferencia entre fotogramas sucesivos (utilizando la estimación de movimiento para encontrar la diferencia entre fotogramas)

La redundancia espacial aprovecha el hecho de que, en general, la dispersión del color en las imágenes tiende a ser de muy baja frecuencia. Con esto quiero decir que los píxeles vecinos tienden a tener colores similares. Por ejemplo, en una imagen de usted que usa un puente rojo, todos los píxeles que representan su puente tendrían un color muy similar. Es posible utilizar el DCT para transformar los valores de píxeles en el espacio de frecuencia, donde se puede desechar cierta información de alta frecuencia. Luego, cuando se realiza el DCT inverso (durante la decodificación), la imagen está ahora sin la información de alta frecuencia desechada.

Para ver los efectos de descartar información de alta frecuencia, abra MS paint y dibuje una serie de líneas negras horizontales y verticales superpuestas. Guarde la imagen como JPEG (que también utiliza DCT para la compresión). Ahora amplíe el patrón, observe cómo los bordes de las líneas ya no son tan nítidos y un poco borrosos. Esto se debe a que cierta información de alta frecuencia (la transición del negro al blanco) se ha eliminado durante la compresión. Lea esto para una explicación con bonitas imágenes

Para más información, este libro es bastante bueno, aunque un poco pesado en matemáticas.


MPEG4 utiliza una variedad de técnicas para comprimir video.

Si aún no has visto wikipedia, este sería un buen punto de partida .

También hay un artículo del IEEE que explica estas técnicas con más detalle.