linux - archivo - readelf
Cuál es la diferencia de sección y segmento en formato de archivo ELF (2)
Del formato ejecutable y enlazable de wiki:
Los segmentos contienen información que es necesaria para la ejecución del archivo en tiempo de ejecución, mientras que las secciones contienen datos importantes para vincular y reubicar. Cualquier byte en el archivo completo puede pertenecer como máximo a una sección, y puede haber bytes huérfanos que no pertenecen a ninguna sección.
¿Pero cuál es la diferencia entre sección y segmento? En un archivo ELF ejecutable, ¿un segmento contiene una o más secciones?
¿Pero cuál es la diferencia entre sección y segmento?
Exactamente lo que citó: los segmentos contienen información necesaria en tiempo de ejecución, mientras que las secciones contienen información necesaria durante el enlace.
¿un segmento contiene una o más secciones?
Un segmento puede contener 0 o más secciones. Ejemplo:
readelf -l /bin/date
Elf file type is EXEC (Executable file)
Entry point 0x402000
There are 9 program headers, starting at offset 64
Program Headers:
Type Offset VirtAddr PhysAddr
FileSiz MemSiz Flags Align
PHDR 0x0000000000000040 0x0000000000400040 0x0000000000400040
0x00000000000001f8 0x00000000000001f8 R E 8
INTERP 0x0000000000000238 0x0000000000400238 0x0000000000400238
0x000000000000001c 0x000000000000001c R 1
[Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
LOAD 0x0000000000000000 0x0000000000400000 0x0000000000400000
0x000000000000d5ac 0x000000000000d5ac R E 200000
LOAD 0x000000000000de10 0x000000000060de10 0x000000000060de10
0x0000000000000440 0x0000000000000610 RW 200000
DYNAMIC 0x000000000000de38 0x000000000060de38 0x000000000060de38
0x00000000000001a0 0x00000000000001a0 RW 8
NOTE 0x0000000000000254 0x0000000000400254 0x0000000000400254
0x0000000000000044 0x0000000000000044 R 4
GNU_EH_FRAME 0x000000000000c700 0x000000000040c700 0x000000000040c700
0x00000000000002a4 0x00000000000002a4 R 4
GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000
0x0000000000000000 0x0000000000000000 RW 8
GNU_RELRO 0x000000000000de10 0x000000000060de10 0x000000000060de10
0x00000000000001f0 0x00000000000001f0 R 1
Section to Segment mapping:
Segment Sections...
00
01 .interp
02 .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame
03 .ctors .dtors .jcr .dynamic .got .got.plt .data .bss
04 .dynamic
05 .note.ABI-tag .note.gnu.build-id
06 .eh_frame_hdr
07
08 .ctors .dtors .jcr .dynamic .got
Aquí, el segmento PHDR
contiene 0 secciones, el segmento INTERP
contiene la sección .interp
, y el primer segmento LOAD
contiene un montón de secciones.
Lectura adicional con una bonita illustration .
La sección contiene información estática para el vinculador, datos dinámicos de segmento para el sistema operativo
La cita es correcta, pero para comprender realmente la diferencia, debe intentar comprender los campos de las entradas de encabezado de sección y encabezado de programa (segmento) y cómo deben ser utilizados por el enlazador (secciones) y el sistema operativo (segmento) .
Informaciones particularmente importantes son (además de las longitudes):
sección: dile al vinculador si una sección es:
- datos sin procesar que se
.text
en la memoria, por ejemplo,.data
,.text
, etc. - o metadatos formateados sobre otras secciones, que serán utilizados por el enlazador, pero desaparecerán en el tiempo de ejecución, por ejemplo,
.srttab
,.rela.text
,.rela.text
- datos sin procesar que se
segmento: le dice al sistema operativo:
- dónde debe cargarse un segmento en la memoria virtual
- qué permisos tienen los segmentos (leer, escribir, ejecutar). Recuerde que esto puede ser aplicado de manera eficiente por el procesador: ¿Cómo funciona la búsqueda x86?
He escrito un tutorial que cubre eso con más detalle en: http://www.cirosantilli.com/elf-hello-world/
¿Un segmento contiene una o más secciones?
Sí, y es el enlazador el que coloca las secciones en segmentos.
En Binutils, la forma en que las secciones se colocan en segmentos por ld
viene determinada por un archivo de texto llamado secuencia de comandos del enlazador . Documentos: https://sourceware.org/binutils/docs/ld/Scripts.html
Puede obtener el predeterminado con ld --verbose
, y establecer uno personalizado con -T
.
Por ejemplo, mi script del enlazador predeterminado de Ubuntu 17.04 contiene:
.text :
{
*(.text.unlikely .text.*_unlikely .text.unlikely.*)
*(.text.exit .text.exit.*)
*(.text.startup .text.startup.*)
*(.text.hot .text.hot.*)
*(.text .stub .text.* .gnu.linkonce.t.*)
}
que le dice al enlazador que ponga secciones llamadas .text.unlikely
, .text.*_unlikely
, .text.exit
, etc. en el segmento .text
.
El desarrollo de SO es un caso donde los scripts personalizados son útiles, un ejemplo mínimo: https://github.com/cirosantilli/x86-bare-metal-examples/blob/d217b180be4220a0b4a453f31275d38e697a99e0/linker.ld
Una vez que el ejecutable está vinculado, solo es posible saber qué sección fue para cada segmento si el vinculador almacena el encabezado de sección opcional en el archivo ejecutable: ¿Dónde está almacenada la "Sección para mapeo de segmentos" en archivos ELF?