para memes meme crotales chistosos chi cerdos cerdo hadoop apache-pig

hadoop - memes - crotales para cerdos



¿Cómo extraigo la primera tupla de una bolsa generada(cuyo tamaño puede variar) en CERDO? (3)

Use DataFu UDF: FirstTupleFromBag ( http://datafu.incubator.apache.org/docs/datafu/1.2.0/datafu/pig/bags/FirstTupleFromBag.html )

Estoy generando una "bolsa" de información cuyo tamaño (número de tuplas dentro de la bolsa) puede variar. A partir de esto, quiero extraer el primer elemento sobre la marcha. ¿Cómo hago esto?


Según los documentos , una bolsa es una colección de tuplas y

La eliminación de referencias de bolsa se puede hacer por nombre (bag.field_name) o position (bolsa. $ 0). Si se desreferencia un conjunto de campos (bolsa. (Nombre1, nombre2) o bolsa. ($ 0, $ 1)), la expresión representa una bolsa compuesta por los campos especificados.

Pero ten cuidado, b.$0 no te da la primera tupla en la bolsa, ¡porque las bolsas no están ordenadas! Obtendrás los primeros elementos de las tuplas constituyentes.

Tendrá que convertir la bolsa a una estructura ordenada, o mejor, usar un UDF. También debe dejar de aceptar esta respuesta (para poder eliminarla) y aceptar a Guarev, que tiene un enlace a un UDF.