Hive: funciones integradas
Este capítulo explica las funciones integradas disponibles en Hive. Las funciones se parecen bastante a las funciones de SQL, excepto por su uso.
Funciones integradas
Hive admite las siguientes funciones integradas:
Tipo de retorno | Firma | Descripción |
---|---|---|
EMPEZANDO | redondo (doble a) | Devuelve el valor BIGINT redondeado del doble. |
EMPEZANDO | piso (doble a) | Devuelve el valor máximo de BIGINT que es igual o menor que el doble. |
EMPEZANDO | techo (doble a) | Devuelve el valor mínimo de BIGINT que es igual o mayor que el doble. |
doble | rand (), rand (int semilla) | Devuelve un número aleatorio que cambia de una fila a otra. |
cuerda | concat (cadena A, cadena B, ...) | Devuelve la cadena resultante de concatenar B después de A. |
cuerda | substr (cadena A, inicio int) | Devuelve la subcadena de A comenzando desde la posición inicial hasta el final de la cadena A. |
cuerda | substr (cadena A, inicio int, longitud int) | Devuelve la subcadena de A a partir de la posición inicial con la longitud dada. |
cuerda | superior (cuerda A) | Devuelve la cadena resultante de convertir todos los caracteres de A a mayúsculas. |
cuerda | ucase (cuerda A) | Lo mismo que arriba. |
cuerda | inferior (cuerda A) | Devuelve la cadena resultante de convertir todos los caracteres de B a minúsculas. |
cuerda | lcase (cuerda A) | Lo mismo que arriba. |
cuerda | recortar (cuerda A) | Devuelve la cadena resultante de recortar espacios de ambos extremos de A. |
cuerda | ltrim (cuerda A) | Devuelve la cadena resultante de recortar espacios desde el principio (lado izquierdo) de A. |
cuerda | rtrim (cuerda A) | rtrim (cadena A) Devuelve la cadena resultante de recortar espacios desde el final (lado derecho) de A. |
cuerda | regexp_replace (cadena A, cadena B, cadena C) | Devuelve la cadena resultante de reemplazar todas las subcadenas en B que coinciden con la sintaxis de expresión regular de Java con C. |
En t | tamaño (Mapa <KV>) | Devuelve el número de elementos del tipo de mapa. |
En t | tamaño (Array <T>) | Devuelve el número de elementos del tipo de matriz. |
valor de <tipo> | emitir (<expr> como <tipo>) | Convierte los resultados de la expresión expr a <tipo>, por ejemplo, cast ('1' como BIGINT) convierte la cadena '1' en su representación integral. Se devuelve NULL si la conversión no se realiza correctamente. |
cuerda | from_unixtime (int unixtime) | convertir el número de segundos de la época de Unix (1970-01-01 00:00:00 UTC) a una cadena que represente la marca de tiempo de ese momento en la zona horaria actual del sistema en el formato de "1970-01-01 00:00: 00 " |
cuerda | to_date (marca de tiempo de la cadena) | Devuelve la parte de la fecha de una cadena de marca de tiempo: to_date ("1970-01-01 00:00:00") = "1970-01-01" |
En t | año (fecha de la cadena) | Devuelve la parte del año de una fecha o una cadena de marca de tiempo: año ("1970-01-01 00:00:00") = 1970, año ("1970-01-01") = 1970 |
En t | mes (fecha de la cadena) | Devuelve la parte del mes de una fecha o una cadena de marca de tiempo: mes ("1970-11-01 00:00:00") = 11, mes ("1970-11-01") = 11 |
En t | día (fecha de la cadena) | Devuelve la parte del día de una fecha o una cadena de marca de tiempo: día ("1970-11-01 00:00:00") = 1, día ("1970-11-01") = 1 |
cuerda | get_json_object (cadena json_string, ruta de la cadena) | Extrae el objeto json de una cadena json según la ruta json especificada y devuelve la cadena json del objeto json extraído. Devuelve NULL si la cadena json de entrada no es válida. |
Ejemplo
Las siguientes consultas demuestran algunas funciones integradas:
función round ()
hive> SELECT round(2.6) from temp;
En la ejecución exitosa de la consulta, puede ver la siguiente respuesta:
3.0
función piso ()
hive> SELECT floor(2.6) from temp;
En la ejecución exitosa de la consulta, puede ver la siguiente respuesta:
2.0
función ceil ()
hive> SELECT ceil(2.6) from temp;
En la ejecución exitosa de la consulta, puede ver la siguiente respuesta:
3.0
Funciones agregadas
Hive admite las siguientes funciones integradas aggregate functions. El uso de estas funciones es el mismo que el de las funciones agregadas de SQL.
Tipo de retorno | Firma | Descripción |
---|---|---|
EMPEZANDO | contar (*), contar (expr), | count (*): devuelve el número total de filas recuperadas. |
DOBLE | suma (columna), suma (columna DISTINTA) | Devuelve la suma de los elementos del grupo o la suma de los distintos valores de la columna del grupo. |
DOBLE | avg (col), avg (col DISTINCT) | Devuelve el promedio de los elementos del grupo o el promedio de los distintos valores de la columna del grupo. |
DOBLE | min (col) | Devuelve el valor mínimo de la columna del grupo. |
DOBLE | max (col) | Devuelve el valor máximo de la columna en el grupo. |