una seleccionar recorrer insertar filtrar filas datos data columnas columna agregar python pandas group-by condition dataframe

seleccionar - Grupo de datos de pandas de Python basado en una condición



seleccionar columnas pandas python (2)

El resultado agrupado es un DataFrame regular, así que simplemente filtra los resultados como de costumbre:

import pandas as pd df = pd.DataFrame({''a'': [''a'', ''b'', ''a'', ''a'', ''b'', ''c'', ''d'']}) after = df.groupby(''a'').size() >> after a a 3 b 2 c 1 d 1 dtype: int64 >> after[after > 2] a a 3 dtype: int64

Mi pregunta es simple, tengo un marco de datos y agrupo los resultados basados ​​en una columna y obtengo el tamaño así:

df.groupby(''column'').size()

Ahora el problema es que solo quiero aquellos en los que el tamaño es mayor que X. Me pregunto si puedo hacerlo usando una función lambda o algo similar. Ya he intentado esto:

df.groupby(''column'').size() > X

E imprime algunos valores True y False.

Gracias


Prueba esto.

df.groupby(''column'').filter(lambda group: group.size > X)