character-encoding - and - star copy paste
¿Cómo afecta “cortar y pegar” a la codificación de caracteres y qué puede salir mal? (1)
Tengo un documento A en la codificación A mostrado en la herramienta A y un documento B en la codificación B mostrado en la herramienta B. Si corto y pego (parte de) B en A, ¿cuál podría ser la codificación de caracteres resultante? Me doy cuenta de que esto depende de la herramienta A y la herramienta B y de la información contenida en el búfer de pegado (que presumiblemente puede contener una codificación) y el sistema operativo.
¿Qué deben hacer las herramientas de alta calidad? y en la práctica, ¿cuántas de las herramientas comunes (por ejemplo, Word, TextPad, varios IDE, etc.) hacen un buen trabajo?
En primer lugar, la representación interna de texto de un editor de texto no influye en cómo se codifica (serializa) el texto al guardar el archivo. Así que un documento no está "en" una codificación; Es una secuencia de caracteres abstractos. Cuando el documento se guarda en un archivo (o se transmite a través de la red), se codifica.
Depende de cada aplicación decidir qué pone en el portapapeles. Por lo general, una aplicación de Windows que sabe lo que está haciendo pondrá varias representaciones diferentes en el portapapeles. Cuando pegue en la otra aplicación, la aplicación buscará la representación que mejor se adapte a sus necesidades.
En su caso, un editor de texto (que sabe lo que está haciendo) pondrá una representación Unicode de una cadena seleccionada en el portapapeles (donde Unicode, en Windows, generalmente se mueve como UTF-16, pero eso no es importante). Cuando pegue en la otra aplicación, insertará esa secuencia de caracteres Unicode en el documento en el punto de selección.
Hay una aplicación llamada "ClipSpy" que te ayudará a ver de qué estoy hablando, de manera interactiva.