extension - Comprender la instrucción "VOLUME" en DockerFile

dockerfile volume example (5)

A continuación se muestra el contenido de mi "Dockerfile"

FROM node:boron # Create app directory RUN mkdir -p /usr/src/app # change working dir to /usr/src/app WORKDIR /usr/src/app VOLUME . /usr/src/app RUN npm install EXPOSE 8080 CMD ["node" , "server" ]

En este archivo espero la instrucción "VOLUME. / Usr / src / app" para montar el contenido del directorio de trabajo actual en el host que se montará en la carpeta / contenedor / usr / src / app.

Por favor, avíseme si esta es la forma correcta?

El comando VOLUME en un Dockerfile es bastante legítimo, totalmente convencional, absolutamente bueno de usar y no está en desuso de ninguna manera. Solo necesito entenderlo.

Lo usamos para señalar cualquier directorio en el que la aplicación en el contenedor escribirá mucho. No usamos VOLUME solo porque queremos compartir entre el host y el contenedor como un archivo de configuración.

El comando simplemente necesita un parámetro; una ruta a una carpeta, relativa a WORKDIR si está establecida, desde dentro del contenedor. Luego, docker creará un volumen en su gráfico (/ var / lib / docker) y lo montará en la carpeta del contenedor. Ahora el contenedor tendrá un lugar para escribir con alto rendimiento. Sin el comando VOLUME la velocidad de escritura en la carpeta especificada será muy lenta porque ahora el contenedor está utilizando su estrategia de copy on write en el propio contenedor. La estrategia de copy on write es una razón principal por la que existen volúmenes.

Si monta sobre la carpeta especificada por el comando VOLUME , el comando nunca se ejecuta porque VOLUME solo se ejecuta cuando se inicia el contenedor, algo así como ENV .

Básicamente con el comando VOLUME obtienes rendimiento sin montar externamente ningún volumen. Los datos también se guardarán en las ejecuciones de contenedores sin ningún montaje externo. Luego, cuando esté listo, simplemente monte algo sobre él.

Algunos buenos ejemplos de casos de uso:
- registros
- carpetas temporales

Algunos casos de mal uso:
- archivos estáticos
- configs
- código

El tutorial oficial de Docker dice:

Un volumen de datos es un directorio especialmente designado dentro de uno o más contenedores que omite el Sistema de archivos de la Unión. Los volúmenes de datos proporcionan varias características útiles para datos persistentes o compartidos:

Los volúmenes se inicializan cuando se crea un contenedor. Si la imagen base del contenedor contiene datos en el punto de montaje especificado,
que los datos existentes se copian en el nuevo volumen tras volumen
inicialización (Tenga en cuenta que esto no se aplica al montar un host
directorio.)

Los volúmenes de datos se pueden compartir y reutilizar entre contenedores.

Los cambios en un volumen de datos se realizan directamente.

Los cambios en un volumen de datos no se incluirán cuando actualice una imagen.

Los volúmenes de datos persisten incluso si se elimina el contenedor en sí.

En Dockerfile puede especificar solo el destino de un volumen dentro de un contenedor. por ejemplo /usr/src/app .

Cuando ejecuta su contenedor, por ejemplo, docker run --volume=/opt:/usr/src/app my_image , puede que no tenga que especificar su punto de montaje ( / opt ) en la máquina host. Si no especifica el argumento --volume , el punto de montaje se elegirá automáticamente.

En resumen: No, su instrucción VOLUME no es correcta.

VOLUME de Dockerfile especifica uno o más volúmenes dados las rutas del lado del contenedor. Pero no permite que el autor de la imagen especifique una ruta de host. En el lado del host, los volúmenes se crean con un nombre de ID muy largo dentro de la raíz de Docker. En mi máquina esto es /var/lib/docker/volumes .

Nota: Debido a que el nombre autogenerado es extremadamente largo y no tiene sentido desde la perspectiva humana, estos volúmenes a menudo se denominan "sin nombre" o "anónimo".

Su ejemplo que usa un ''.'' el personaje ni siquiera se ejecutará en mi máquina, no importa si hago que el punto sea el primer o segundo argumento. Me sale este mensaje de error:

docker: Respuesta de error del daemon: error de tiempo de ejecución oci: container_linux.go: 265: el proceso de inicio del contenedor causó "process_linux.go: 368: el inicio del contenedor causó /" abrir / dev / ptmx: no existe tal archivo o directorio / "".

Sé que lo que se ha dicho hasta este punto probablemente no sea muy valioso para alguien que intente comprender VOLUME y -v y ciertamente no proporciona una solución para lo que intenta lograr. Entonces, con suerte, los siguientes ejemplos arrojarán algo más de luz sobre estos temas.

Minitutorial: especificación de volúmenes

Dado este Dockerfile:

FROM openjdk:8u131-jdk-alpine VOLUME vol1 vol2

(Para el resultado de este minitutorial, no hay diferencia si especificamos vol1 vol2 o /vol1 /vol2 ; no me pregunten por qué)

Constrúyelo:

docker build -t my-openjdk

Correr:

docker run --rm -it my-openjdk

Dentro del contenedor, ejecute ls en la línea de comando y notará que existen dos directorios; /vol1 y /vol2 .

La ejecución del contenedor también crea dos directorios, o "volúmenes", en el lado del host.

Mientras se ejecuta el contenedor, ejecute docker volume ls en la máquina host y verá algo como esto (he reemplazado la parte central del nombre con tres puntos por brevedad):

DRIVER VOLUME NAME local c984...e4fc local f670...49f0

De vuelta en el contenedor , ejecute touch /vol1/weird-ass-file (crea un archivo en blanco en dicha ubicación).

Este archivo ahora está disponible en la máquina host, en uno de los volúmenes sin nombre jajaja. Me tomó dos intentos porque primero probé el primer volumen listado, pero finalmente encontré mi archivo en el segundo volumen listado, usando este comando en la máquina host:

sudo ls /var/lib/docker/volumes/f670...49f0/_data

Del mismo modo, puede intentar eliminar este archivo en el host y también se eliminará en el contenedor.

Nota: La carpeta _data también se conoce como "punto de montaje".

Salga del contenedor y enumere los volúmenes en el host. Se han ido. Utilizamos el indicador --rm cuando --rm el contenedor y esta opción elimina efectivamente no solo el contenedor al salir, sino también los volúmenes.

Ejecute un nuevo contenedor, pero especifique un volumen usando -v :

docker run --rm -it -v /vol3 my-openjdk

Esto agrega un tercer volumen y todo el sistema termina teniendo tres volúmenes sin nombre. El comando habría -v vol3 si hubiéramos especificado solo -v vol3 . El argumento debe ser una ruta absoluta dentro del contenedor. En el lado del host, el nuevo tercer volumen es anónimo y reside junto con los otros dos volúmenes en /var/lib/docker/volumes/ .

Anteriormente se dijo que el Dockerfile no se puede asignar a una ruta de host, lo que nos plantea un problema al intentar traer archivos desde el host al contenedor durante el tiempo de ejecución. Una sintaxis -v diferente resuelve este problema.

Imagine que tengo una subcarpeta en mi directorio de proyectos ./src que deseo sincronizar con /src dentro del contenedor. Este comando hace el truco:

docker run -it -v $(pwd)/src:/src my-openjdk

Ambos lados del : personaje espera un camino absoluto. El lado izquierdo es una ruta absoluta en la máquina host, el lado derecho es una ruta absoluta dentro del contenedor. pwd es un comando que "imprime el directorio actual / de trabajo". Poner el comando en $() toma el comando entre paréntesis, lo ejecuta en un subshell y devuelve la ruta absoluta a nuestro directorio de proyecto.

Poniéndolo todo junto, suponga que tenemos ./src/Hello.java en nuestra carpeta de proyecto en la máquina host con el siguiente contenido:

public class Hello { public static void main(String... ignored) { System.out.println("Hello, World!"); } }

Construimos este Dockerfile:

FROM openjdk:8u131-jdk-alpine WORKDIR /src ENTRYPOINT javac Hello.java && java Hello

Ejecutamos este comando:

docker run -v $(pwd)/src:/src my-openjdk

Esto imprime "¡Hola, mundo!".

La mejor parte es que somos completamente libres de modificar el archivo .java con un nuevo mensaje para otra salida en una segunda ejecución, sin tener que reconstruir la imagen =)

Observaciones finales

Soy bastante nuevo en Docker, y el "tutorial" mencionado anteriormente refleja la información que obtuve de un hackathon de línea de comandos de 3 días. Estoy casi avergonzado de no haber podido proporcionar enlaces a documentación clara en inglés que respalde mis declaraciones, pero honestamente creo que esto se debe a la falta de documentación y no al esfuerzo personal. Sé que los ejemplos funcionan según lo anunciado usando mi configuración actual que es "Windows 10 -> Vagrant 2.0.0 -> Docker 17.09.0-ce".

El tutorial no resuelve el problema "cómo especificamos la ruta del contenedor en el Dockerfile y dejamos que el comando ejecutar solo especifique la ruta del host". Puede haber una manera, simplemente no la he encontrado.

Finalmente, tengo el presentimiento de que especificar VOLUME en el Dockerfile no solo es infrecuente, sino que probablemente sea una mejor práctica nunca usar VOLUME . Por dos razones. La primera razón por la que ya hemos identificado: no podemos especificar la ruta del host, lo cual es bueno porque los Dockerfiles deben ser muy independientes de los detalles de una máquina host. Pero la segunda razón es que las personas podrían olvidarse de usar la opción --rm al ejecutar el contenedor. Uno podría recordar quitar el contenedor pero olvidarse de quitar el volumen. Además, incluso con la mejor memoria humana, podría ser una tarea desalentadora descubrir cuál de todos los volúmenes anónimos es seguro eliminar.

Especificar una línea VOLUME en un Dockerfile configura un poco de metadatos en su imagen, pero es importante cómo se usan esos metadatos.

Primero, qué hicieron estas dos líneas:

WORKDIR /usr/src/app VOLUME . /usr/src/app

La línea WORKDIR allí crea el directorio si no existe, y actualiza algunos metadatos de imagen para especificar todas las rutas relativas, junto con el directorio actual para comandos como RUN estarán en esa ubicación. La línea VOLUME allí especifica dos volúmenes , uno es la ruta relativa . , y el otro es /usr/src/app , ambos resultan ser el mismo directorio. Muy a menudo, la línea VOLUME solo contiene un único directorio, pero puede contener múltiples como lo ha hecho, o puede ser una matriz con formato json.

No puede especificar una fuente de volumen en el Dockerfile : una fuente común de confusión cuando se especifican volúmenes en un Dockerfile está tratando de hacer coincidir la sintaxis de tiempo de ejecución de una fuente y un destino en el momento de la creación de la imagen, esto no funcionará . El Dockerfile solo puede especificar el destino del volumen. Sería una hazaña de seguridad trivial si alguien pudiera definir la fuente de un volumen, ya que podría actualizar una imagen común en el Docker Hub para montar el directorio raíz en el contenedor y luego iniciar un proceso en segundo plano dentro del contenedor como parte de un punto de entrada que agrega inicios de sesión a / etc / passwd, configura systemd para lanzar un minero de bitcoin en el próximo reinicio, o busca en el sistema de archivos tarjetas de crédito, SSN y claves privadas para enviar a un sitio remoto.

¿Qué hace la línea VOLUME? Como se mencionó, establece algunos metadatos de imagen para decir que un directorio dentro de la imagen es un volumen. ¿Cómo se usan estos metadatos? Cada vez que cree un contenedor a partir de esta imagen, Docker forzará ese directorio a ser un volumen. Si no proporciona un volumen en su comando de ejecución, o redacta un archivo, la única opción para Docker es crear un volumen anónimo. Este es un volumen con nombre local con una identificación única larga para el nombre y ninguna otra indicación de por qué se creó o qué datos contiene (los volúmenes anónimos se pierden). Si anula el volumen, apuntando a un volumen con nombre o de host, sus datos irán allí.

VOLUME rompe cosas: no puede deshabilitar un volumen una vez definido en un Dockerfile. Y lo más importante, el comando EJECUTAR en Docker se implementa con contenedores temporales. Esos contenedores temporales obtendrán un volumen anónimo temporal. Ese volumen anónimo se inicializará con el contenido de su imagen. Cualquier escritura dentro del contenedor desde su comando RUN se realizará en ese volumen. Cuando finaliza el comando EJECUTAR, se guardan los cambios en la imagen y se descartan los cambios en el volumen anónimo. Debido a esto, recomiendo no definir un VOLUME dentro del Dockerfile. Resulta en un comportamiento inesperado para los usuarios intermedios de su imagen que desean extender la imagen con datos iniciales en la ubicación del volumen.

¿Cómo debe especificar un volumen? Para especificar dónde desea incluir volúmenes con su imagen, proporcione un docker-compose.yml . Los usuarios pueden modificar eso para ajustar la ubicación del volumen a su entorno local, y captura otras configuraciones de tiempo de ejecución como puertos de publicación y redes.

¡Alguien debería documentar esto! Ellos tienen. Docker incluye advertencias sobre el uso de VOLUME en su documentación en el Dockerfile junto con consejos para especificar la fuente en tiempo de ejecución:

Cambiar el volumen desde el Dockerfile: si alguno de los pasos de compilación cambia los datos dentro del volumen después de que se haya declarado, esos cambios se descartarán.

...

El directorio del host se declara en tiempo de ejecución del contenedor: el directorio del host (el punto de montaje) depende, por su naturaleza, del host. Esto es para preservar la portabilidad de la imagen, ya que no se puede garantizar que un directorio de host determinado esté disponible en todos los hosts. Por este motivo, no puede montar un directorio de host desde el Dockerfile. La instrucción VOLUME no admite la especificación de un parámetro host-dir . Debe especificar el punto de montaje cuando cree o ejecute el contenedor.

Para comprender mejor la instrucción de volume en dockerfile, aprendamos el uso de volumen típico en la implementación del archivo docker oficial mysql.

VOLUME /var/lib/mysql

Referencia: https://github.com/docker-library/mysql/blob/3362baccb4352bcf0022014f67c1ec7e6808b8c5/8.0/Dockerfile

/var/lib/mysql es la ubicación predeterminada de MySQL que almacena archivos de datos.

Cuando ejecuta el contenedor de prueba solo con fines de prueba, no puede especificar su punto de montaje, p. Ej.

docker run mysql:8

entonces la instancia del contenedor mysql usará la ruta de montaje predeterminada que se especifica mediante la instrucción de volume en dockerfile. los volúmenes se crean con un nombre de ID muy largo dentro de la raíz de Docker, esto se llama volumen "sin nombre" o "anónimo". En la carpeta del sistema host subyacente / var / lib / docker / volume.

/var/lib/docker/volumes/320752e0e70d1590e905b02d484c22689e69adcbd764a69e39b17bc330b984e4

Esto es muy conveniente para propósitos de prueba rápida sin la necesidad de especificar el punto de montaje, pero aún puede obtener el mejor rendimiento al usar Volumen para el almacenamiento de datos, no la capa de contenedor.

Para un uso formal, deberá especificar la ruta de montaje anulando el punto de montaje para usar el volumen con nombre, por ejemplo

docker run -v /my/own/datadir:/var/lib/mysql mysql:8

El comando monta el directorio / my / own / datadir desde el sistema host subyacente como / var / lib / mysql dentro del contenedor. El directorio de datos / my / own / datadir no se eliminará automáticamente, incluso se eliminará el contenedor.

Uso de la imagen oficial de mysql: Referencia: https://hub.docker.com/_/mysql/