Representación de datos / información

La computadora no comprende el lenguaje humano. Todos los datos, a saber, letras, símbolos, imágenes, audio, videos, etc., que se envíen a la computadora deben convertirse primero al lenguaje de máquina. Las computadoras representan datos en las siguientes tres formas:

Sistema de numeración

Se nos presenta el concepto de números desde una edad muy temprana. Para una computadora, todo es un número, es decir, alfabetos, imágenes, sonidos, etc., son números. El sistema numérico se clasifica en cuatro tipos:

  • El sistema numérico binario consta de solo dos valores, 0 o 1

  • El sistema de números octales representa valores en 8 dígitos.

  • El sistema de números decimales representa valores en 10 dígitos.

  • El sistema numérico hexadecimal representa valores en 16 dígitos.

Sistema de numeración
Sistema Base Dígitos
Binario 2 0 1
Octal 8 0 1 2 3 4 5 6 7
Decimal 10 0 1 2 3 4 5 6 7 8 9
Hexadecimal dieciséis 0 1 2 3 4 5 6 7 8 9 ABCDEF

Bits y Bytes

Bits- Un bit es la unidad de datos más pequeña posible que una computadora puede reconocer o usar. La computadora generalmente usa bits en grupos.

Bytes- el grupo de ocho bits se denomina byte. La mitad de un byte se llama nibble.

La siguiente tabla muestra la conversión de Bits y Bytes:

Valor de byte Valor de bit
1 byte 8 bits
1024 bytes 1 kilobyte
1024 kilobytes 1 megabyte
1024 megabytes 1 gigabyte
1024 gigabytes 1 terabyte
1024 terabytes 1 petabyte
1024 Petabytes 1 Exabyte
1024 Exabytes 1 Zettabyte
1024 Zettabytes 1 Yottabyte
1024 Yottabytes 1 Brontobyte
1024 Brontobytes 1 geopbytes

Código de texto

El código de texto es un formato que se usa comúnmente para representar alfabetos, signos de puntuación y otros símbolos. Los cuatro sistemas de códigos de texto más populares son:

  • EBCDIC
  • ASCII
  • ASCII extendido
  • Unicode

EBCDIC

El código de intercambio decimal codificado en binario extendido es un código de 8 bits que define 256 símbolos. A continuación se muestra el EBCDICTabular column

ASCII

El código estándar americano para el intercambio de información es un código de 8 bits que especifica valores de caracteres de 0 a 127.

ASCII Tabular column

Código ASCII Valor decimal Personaje
0000 0000 0 Aviso nulo
0000 0001 1 Inicio del encabezado
0000 0010 2 Inicio del texto
0000 0011 3 Fin del texto
0000 0100 4 Fin de transmisión
0000 0101 5 Investigación
0000 0110 6 Reconocer
0000 0111 7 Campana audible
0000 1000 8 Retroceso
0000 1001 9 Pestaña horizontal
0000 1010 10 Linea de alimentación

ASCII extendido

El código estándar americano extendido para el intercambio de información es un código de 8 bits que especifica valores de caracteres de 128 a 255.

Columna tabular ASCII extendida

Unicode

El estándar mundial de caracteres Unicode utiliza de 4 a 32 bits para representar letras, números y símbolos.

Unicode Tabular Column