validator validate test regular pattern online one golang check ruby unicode encoding cjk character-properties

ruby - validate - regex perl online



Cómo determinar si un personaje es un personaje chino (2)

Un interesante artículo sobre codificaciones en Ruby: http://blog.grayproductions.net/articles/bytes_and_characters_in_ruby_18 (es parte de una serie - verifique la tabla de contenidos al principio del artículo también)

No he usado caracteres chinos anteriormente, pero esta parece ser la lista admitida por Unicode: http://en.wikipedia.org/wiki/List_of_CJK_Unified_Ideographs . También tenga en cuenta que se trata de un sistema unificado que incluye caracteres japoneses y coreanos (algunos caracteres se comparten entre ellos). No estoy seguro si puede distinguir cuáles son solo chinos.

Creo que puedes verificar si se trata de un personaje CJK llamando a esto str cadena y personaje con índice n:

def check_char(str, n) list_of_chars = str.unpack("U*") char = list_of_chars[n] #main blocks if char >= 0x4E00 && char <= 0x9FFF return true end #extended block A if char >= 0x3400 && char <= 0x4DBF return true end #extended block B if char >= 0x20000 && char <= 0x2A6DF return true end #extended block C if char >= 0x2A700 && char <= 0x2B73F return true end return false end

¿Cómo determinar si un personaje es un personaje chino que usa ruby?


Ruby 1.9

#encoding: utf-8 "漢" =~ //p{Han}/