Apache Pig - ALEATORIO ()

los RANDOM() La función se usa para obtener un número pseudoaleatorio (tipo double) mayor o igual que 0.0 y menor que 1.0.

grunt> RANDOM()

Ejemplo

Suponga que hay un archivo llamado math.txt en el HDFS directorio /pig_data/. Este archivo contiene valores enteros y de punto flotante como se muestra a continuación.

math.txt

5 
16 
9 
2.5 
5.9 
3.1

Y hemos cargado este archivo en Pig con una relación llamada math_data Como se muestra abajo.

grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',')
   as (data:float);

Generemos ahora valores aleatorios del contenido del archivo math.txt usando RANDOM() funcionar como se muestra a continuación.

grunt> random_data = foreach math_data generate (data), RANDOM();

La declaración anterior almacena el resultado en la relación denominada random_data. Verifique el contenido de la relación usando el operador Dump como se muestra a continuación.

grunt> Dump random_data;
  
(5.0,0.6842057767279982) 
(16.0,0.9725172591786139) 
(9.0,0.4159326414649489) 
(2.5,0.30962777780713147) 
(5.9,0.705213727551145) 
(3.1,0.24247708413861724)