traductor significado mandarin letras español chino chinas china abecedario php localization internationalization cjk

php - significado - Conversión del chino simplificado al chino tradicional



traductor de español a chino mandarin (6)

¿Es posible convertir de forma confiable y automática el texto a chino tradicional de una manera de alta calidad?

Otras respuestas se centran en las dificultades, pero estas son exageradas. Una cosa es que una parte sustancial de los personajes son exactamente iguales. Lo segundo es que las formas ''simplificadas'' son exactamente eso: formas simplificadas de los caracteres tradicionales. Eso significa que en su mayoría hay una relación 1 a 1 entre los caracteres tradicionales y simplificados.

Si es así, ¿será de una calidad extremadamente alta o solo un buen punto de partida para que un traductor modifique?

Algunas cosas necesitarán ajustes.

¿Existen herramientas de código abierto (idealmente en PHP) para hacer tal conversión?

No que yo sepa, aunque es posible que desee revisar la API de Google Translate.

¿La conversión es mejor de una manera en comparación con la otra (simplificada -> tradicional, o viceversa)?

Unos pocos personajes perdieron distinción en el alfabeto simplificado. Por ejemplo, 麵 (harina) se simplificó al mismo carácter que 面 (cara, lado). Por esta razón, tradicional-> simplificado sería un poco más preciso.

También me gustaría señalar que los caracteres tradicionales no se usan únicamente en Taiwán (se pueden encontrar en HK y, ocasionalmente, incluso en el continente)

Pude encontrar this y this . Sin embargo, es necesario crear una cuenta para descargar. Nunca usé el sitio por lo que no puedo responder por él.

Si un sitio web está localizado / internacionalizado con una traducción en chino simplificado ...

  • ¿Es posible convertir de forma confiable y automática el texto a chino tradicional de una manera de alta calidad?
  • Si es así, ¿será de una calidad extremadamente alta o solo un buen punto de partida para que un traductor modifique?
  • ¿Existen herramientas de código abierto (idealmente en PHP) para hacer tal conversión?
  • ¿La conversión es mejor de una manera en comparación con la otra (simplificada -> tradicional, o viceversa)?

Como nativo de Hong Kong, estoy de acuerdo con @JasonTrue: no lo hagas. Corre el riesgo de enojar y ofender a sus usuarios potenciales en Taiwán y Hong Kong.

PERO , si aún insiste en hacerlo, eche un vistazo a cómo lo hace Wikipedia ; here hay una implementación (nota de licencia).


Fundamentalmente, las palabras en chino simplificado tienen muchos significados que faltan. Ningún lenguaje de programación en el mundo podrá convertir con precisión el chino simplificado al chino tradicional. Solo causará confusión para su público objetivo (Hong Kong, Macao, Taiwán).

Un ejemplo perfecto de traducción fallida del chino simplificado al chino tradicional es la palabra "后". En la forma simplificada, tiene dos significados, "detrás" o "reina". Sin embargo, cuando intenta convertir esto de nuevo a chino tradicional, puede haber más de dos opciones de caracteres: 後 "detrás" o 后 "reina". Un ejemplo divertido que encontré es un traductor que convirtió "皇后 大道" Queen''s Road en "皇後 大道", que literalmente significa Queen''s Behind Road.

A menos que su algoritmo de traducción sea súper inteligente, está obligado a producir errores. Así que es mejor que contrates a un buen traductor que domina ambos tipos de chino.


No sé nada sobre ninguna forma de chino, pero al mirar los ejemplos en esta página de Wikipedia me inclino a pensar que la conversión automática es posible, ya que muchas de las frases parecen usar la misma cantidad de caracteres e incluso algunos de los mismos personajes

Realicé una prueba rápida utilizando una función ord() varios bytes y no puedo ver ningún patrón que permita la conversión automática sin el uso de una tabla de traducción de búsqueda (¿enorme?).

Traditional Chinese 漢字 Simplified Chinese 汉字 function mb_ord($string) { if (is_array($result = unpack(''N'', iconv(''UTF-8'', ''UCS-4BE'', $string))) === true) { return $result[1]; } return false; } var_dump(mb_ord(''漢''), mb_ord(''字'')); // 28450, 23383 var_dump(mb_ord(''汉''), mb_ord(''字'')); // 27721, 23383

Este podría ser un buen lugar para comenzar a construir el LUTT:

Llegué a esta otra respuesta vinculada que parece estar de acuerdo (hasta cierto punto) con mi razonamiento:

Hay varios países donde el chino es el principal idioma escrito. La principal diferencia entre ellos es si utilizan caracteres simplificados o tradicionales, pero también hay diferencias regionales menores (en vocabulario, etc.).


Respuesta corta: No, no confiablemente + alta calidad. No recomendaría herramientas automatizadas a menos que el mercado no sea tan importante para usted y usted pueda arriesgarse a ciertos fallos públicamente embarazosos. Es posible que algunas empresas de localización estén felices de comenzar con una traducción china simplificada de calidad y de adaptarla a la tradicional, pero también pueden encontrar que muchas empresas prefieren comenzar con la fuente en inglés.

Respuesta más larga: hay algunos casos en los que solo los glifos son diferentes y tienen puntos de código Unicode diferentes. Pero también hay algunas diferencias idiomáticas y de vocabulario entre el PRC y Taiwán / Hong Kong, y su calidad se verá afectada si no se manejan. Los términos técnicos pueden ser más problemáticos o menos, dependiendo de la época en que los términos se usaron comúnmente. Algunos de estos problemas pueden ser atrapados por herramientas automatizadas, pero no todas. Ciertamente, si toma la ruta de convertir cosas automáticamente, asegúrese de obtener la recompensa de los equipos de control de calidad basados ​​en cada uno de sus mercados objetivo.

Además, también hay preocupaciones sociopolíticas. Por ejemplo, puede usar términos como "República de China" en Taiwán, pero esto enloquecerá al gobierno chino si aparece en su versión china simplificada (y algunas veces en su versión en inglés); Si tiene una filial o socio en China, el personal puede ser arrestado únicamente sobre la base de terminología subversiva. (Esto no es exclusivo de China; Pakistán / India y Turquía tienen problemas similares). Puedes meterte en problemas similares refiriéndose a "Taiwán" como "país".


Respuesta corta: sí. Y es facil Primero puede convertirlo de UTF-8 a BIG5, luego hay muchas herramientas para convertir BIG5 a GBK, luego puede convertir GBK a UTF-8.