teclas teclado separador retroceso husky grupo desplazamiento codigo caracter barra text unicode history control-characters

text - teclado - grupo ascii



¿Cuáles son los caracteres de control del separador de archivos/grupos/registros/unidades y su uso? (2)

Unicode define varios caracteres de control desde ASCII. http://www.unicode.org/charts/PDF/U0000.pdf

Veo que muchos caracteres de control son ampliamente utilizados, pero realmente no veo dónde se usan los "separadores de información". (U + 001C ~ U + 001F)

¿Cuáles son? ¿Cuál es la historia de ellos? ¿Dónde lo usaban?


¿Quiso decir que la mayoría de ellos generalmente no se usan en estos días? Los caracteres de control se relacionan principalmente con las funciones de control del dispositivo, pero algunos de ellos se pueden haber usado como separadores en archivos de texto. Para una referencia rápida, consulte mi tabla de controles C0 .

Los separadores de información se han usado para agrupar datos de una manera simple, pero en la actualidad, se utilizan formatos binarios o formatos XML para la organización de datos. Todavía hay curiosidades, como el uso interno de U + 001E y U + 001F en Microsoft Word para implementar la propia idea del programa de "guión no separable" y "guión opcional" (como opuesto a los caracteres Unicode para propósitos similares). Esto ilustra principalmente que los programas pueden usar caracteres de control de maneras extrañas. Los problemas surgen, por supuesto, si los personajes se incluyen en el texto transmitido a otros programas.


Lammert Bies explica tanto su uso como la historia detrás.

28 - FS - Separador de archivos El separador de archivos FS es un código de control interesante, ya que nos da una idea de cómo se organizó la tecnología informática en los años sesenta. Ahora estamos acostumbrados a medios de acceso aleatorio como RAM y discos magnéticos, pero cuando se definió el estándar ASCII, la mayoría de los datos eran en serie. No solo estoy hablando de comunicaciones en serie, sino también de almacenamiento en serie como tarjetas perforadas, cintas de papel y cintas magnéticas. En tal situación, es claramente eficiente tener un solo código de control para señalar la separación de dos archivos. El FS fue definido para este propósito.

29 - GS - Separador de grupos El almacenamiento de datos fue una de las principales razones por las que algunos códigos de control se incluyeron en la definición ASCII. Las bases de datos son la mayoría de las veces configuradas con tablas, que contienen registros. Todos los registros en una tabla tienen el mismo tipo, pero los registros de tablas diferentes pueden ser diferentes. El separador de grupos GS se define para separar las tablas en un sistema de almacenamiento de datos en serie. Tenga en cuenta que la tabla de palabras no se utilizó en ese momento y las personas ASCII lo llamaron un grupo.

30 - RS - Separador de registros Dentro de un grupo (o tabla) los registros se separan con RS o separador de registros.

31 - EE. UU. - Separador de unidades Los elementos de datos más pequeños que se almacenarán en una base de datos se denominan unidades en la definición ASCII. Los llamaríamos campo ahora. El separador de unidades separa estos campos en un entorno de almacenamiento de datos en serie. La mayoría de las implementaciones de bases de datos actuales requieren que los campos de la mayoría de los tipos tengan una longitud fija. Se asigna suficiente espacio en el registro para almacenar el miembro más grande posible de cada campo, incluso si esto no es necesario en la mayoría de los casos. Esto cuesta una gran cantidad de espacio en muchas situaciones. El código de control de EE. UU. Permite que todos los campos tengan una longitud variable. Si el espacio de almacenamiento de datos es limitado, como en los años sesenta, esta es una buena manera de preservar un espacio valioso. Por otro lado, el almacenamiento en serie es mucho menos eficiente que la RAM y las implementaciones de disco de los tiempos modernos. No puedo imaginarme una situación en la que las bases de datos SQL modernas se ejecuten con los datos almacenados en cintas de papel o carretes magnéticos ...

Un separador de unidades podría proporcionar esencialmente el mismo propósito que una coma en un archivo CSV o una pestaña en un archivo delimitado por tabuladores.