Python Pandas - Visualización
Trazado básico: trama
Esta funcionalidad en Series y DataFrame es solo una envoltura simple alrededor del matplotlib libraries plot() método.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
periods=10), columns=list('ABCD'))
df.plot()
Sus output es como sigue -
Si el índice consta de fechas, llama gct().autofmt_xdate() para formatear el eje x como se muestra en la ilustración anterior.
Podemos trazar una columna frente a otra usando el x y y palabras clave.
Los métodos de trazado permiten un puñado de estilos de trazado distintos del trazado de líneas predeterminado. Estos métodos se pueden proporcionar como el argumento de palabra clave kind paraplot(). Estos incluyen:
- bar o barh para parcelas de barras
- hist para histograma
- caja para diagrama de caja
- 'área' para parcelas de área
- 'scatter' para diagramas de dispersión
Gráfico de barras
Veamos ahora qué es un gráfico de barras creando uno. Se puede crear un diagrama de barras de la siguiente manera:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()
Sus output es como sigue -
Para producir un diagrama de barras apiladas, pass stacked=True -
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)
Sus output es como sigue -
Para obtener diagramas de barras horizontales, use el barh método -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.barh(stacked=True)
Sus output es como sigue -
Histogramas
Los histogramas se pueden trazar usando el plot.hist()método. Podemos especificar el número de contenedores.
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
Sus output es como sigue -
Para trazar diferentes histogramas para cada columna, use el siguiente código:
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.diff.hist(bins=20)
Sus output es como sigue -
Diagramas de caja
El diagrama de caja se puede dibujar llamando Series.box.plot() y DataFrame.box.plot()o DataFrame.boxplot() para visualizar la distribución de valores dentro de cada columna.
Por ejemplo, aquí hay una gráfica de caja que representa cinco ensayos de 10 observaciones de una variable aleatoria uniforme en [0,1).
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
Sus output es como sigue -
Parcela de área
La gráfica de área se puede crear usando el Series.plot.area() o la DataFrame.plot.area() métodos.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
Sus output es como sigue -
Gráfico de dispersión
El diagrama de dispersión se puede crear usando el DataFrame.plot.scatter() métodos.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
Sus output es como sigue -
Gráfico circular
El gráfico circular se puede crear usando el DataFrame.plot.pie() método.
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
Sus output es como sigue -