utf16 toy hexadecimal english convertir json unicode encoding

toy - JSON especifica "cualquier carácter UNICODE"?



unicode to utf16 (3)

Tal vez este es solo mi desconocimiento de Unicode, así que por favor corrígeme si me equivoco.

Mirando http://json.org/ , la especificación dice que una cadena puede incluir "cualquier carácter UNICODE", pero esto me confunde.

  • JSON es un formato de comunicación correcto? En esencia, todo se debe traducir a bytes.
  • Por el contrario, UNICODE es un formato lógico y debe estar codificado para poder transmitirlo, ¿verdad?

Entonces, ¿qué significaban allí?


JSON es un formato de serialización que puede incluir caracteres UNICODE. La representación de bytes de esta cadena Unicode generalmente se envía por cable, normalmente a través del protocolo HTTP que usa encabezados HTTP para especificar la codificación para el cliente que es UTF-8.


Tiene razón en que todo debe traducirse en bytes, y generalmente eso generalmente ocurre a través de un UTF (Formato de Transformación Unicode). El JSON RFC explica en la sección 3 cómo saber qué UTF se está utilizando.


De la RFC :

3. Encoding JSON text SHALL be encoded in Unicode. The default encoding is UTF-8. Since the first two characters of a JSON text will always be ASCII characters [RFC0020], it is possible to determine whether an octet stream is UTF-8, UTF-16 (BE or LE), or UTF-32 (BE or LE) by looking at the pattern of nulls in the first four octets. 00 00 00 xx UTF-32BE 00 xx 00 xx UTF-16BE xx 00 00 00 UTF-32LE xx 00 xx 00 UTF-16LE xx xx xx xx UTF-8