seleccionar - Grupo de datos de pandas de Python basado en una condición
seleccionar columnas pandas python (2)
El resultado agrupado es un DataFrame regular, así que simplemente filtra los resultados como de costumbre:
import pandas as pd
df = pd.DataFrame({''a'': [''a'', ''b'', ''a'', ''a'', ''b'', ''c'', ''d'']})
after = df.groupby(''a'').size()
>> after
a
a 3
b 2
c 1
d 1
dtype: int64
>> after[after > 2]
a
a 3
dtype: int64
Mi pregunta es simple, tengo un marco de datos y agrupo los resultados basados en una columna y obtengo el tamaño así:
df.groupby(''column'').size()
Ahora el problema es que solo quiero aquellos en los que el tamaño es mayor que X. Me pregunto si puedo hacerlo usando una función lambda o algo similar. Ya he intentado esto:
df.groupby(''column'').size() > X
E imprime algunos valores True y False.
Gracias
Prueba esto.
df.groupby(''column'').filter(lambda group: group.size > X)