hadoop - peds - ¿Cómo reemplazar personajes en colmena?
pagina de skins de gta sa (5)
No hay ninguna función OOTB en este momento que permita esto. Una forma de lograrlo podría ser escribir un InputFormat y / o SerDe personalizado que lo haga por usted. Podría ser útil este JIRA: https://issues.apache.org/jira/browse/HIVE-3751 . (aunque no relacionado directamente con su problema).
Tengo una description
columna de cadena en una tabla de subárbol que puede contener caracteres de tabulación ''/t''
; sin embargo, estos caracteres están confundiendo algunas vistas cuando se conecta el subárbol a una aplicación externa. ¿hay una forma sencilla de deshacerse de todos los caracteres de tabulación en esa columna? Podría ejecutar un programa Python simple para hacerlo, pero quiero encontrar una mejor solución para esto.
SerDe personalizado podría ser una manera de hacerlo. O podría usar algún tipo de proceso de mediación con regex_replace:
create table tableB as
select
columnA
regexp_replace(description, ''//t'', '''') as description
from tableA
;
También puedes usar translate (). Si el tercer argumento es demasiado corto, los caracteres correspondientes del segundo argumento se eliminan. A diferencia de regexp_replace (), no necesita preocuparse por los caracteres especiales. Código fuente
regexp_replace
UDF realiza mi tarea. A continuación se muestra la definición y el uso de Wiki de apache.
regexp_replace(string INITIAL_STRING, string PATTERN, string REPLACEMENT):
Esto devuelve la cadena resultante de reemplazar todas las subcadenas en INITIAL_STRING
que coinciden con la sintaxis de expresión regular java definida en PATTERN
con instancias de REPLACEMENT
,
por ejemplo: regexp_replace("foobar", "oo|ar", "")
devuelve fb
select translate(description,''//t'','''') from myTable;
Traduce la cadena de entrada reemplazando los caracteres presentes en la cadena desde por los caracteres correspondientes en la cadena hasta. Esto es similar a la función de traducción en PostgreSQL. Si alguno de los parámetros de este UDF es NULL, el resultado también es NULL. (Disponible a partir de Hive 0.10.0, para tipos de cadena)
Soporte Char / Varchar añadido a partir de Hive 0.14.0