sirve que para caracteres character-encoding byte

character encoding - que - ¿Cuántos bits hay en un personaje?



utf-8 html para que sirve (2)

Depende de qué es el personaje y en qué codificación está:

  • Un carácter ASCII en la codificación ASCII de 8 bits es de 8 bits (1 byte), aunque puede caber en 7 bits.

  • Un carácter ISO-8895-1 en la codificación ISO-8859-1 es de 8 bits (1 byte).

  • Un carácter Unicode en la codificación UTF-8 está entre 8 bits (1 byte) y 32 bits (4 bytes).

  • Un carácter Unicode en la codificación UTF-16 está entre 16 (2 bytes) y 32 bits (4 bytes), aunque la mayoría de los caracteres comunes toman 16 bits. Esta es la codificación utilizada internamente por Windows.

  • Un carácter Unicode en la codificación UTF-32 siempre es de 32 bits (4 bytes).

  • Un carácter ASCII en UTF-8 es de 8 bits (1 byte) y en UTF-16 es de 16 bits.

  • Los caracteres adicionales (no ASCII) en ISO-8895-1 (0xA0-0xFF) tomarían 16 bits en UTF-8 y UTF-16.

Eso significaría que hay entre 0.03125 y 0.125 caracteres en un bit.

¿Cuántos bits o bytes hay por "personaje"?


Hay 8 bits en un byte (normalmente hablando en Windows).

Sin embargo, si está tratando con caracteres, dependerá del juego de caracteres / codificación. El carácter Unicode puede ser de 2 o 4 bytes, por lo que sería de 16 o 32 bits, mientras que Windows-1252 veces incorrectamente llamado ANSI es solo de 1 by 8 bits.

En la versión asiática de Windows y algunos otros, todo el sistema se ejecuta en doble byte, por lo que un personaje tiene 16 bits.

EDITADO

Según el comentario de Matteo, todas las versiones contemporáneas de Windows usan internamente 16 bits por personaje.