python - sns - seaborn vs matplotlib
Seaborn load_dataset (3)
Estoy intentando hacer un diagrama de caja agrupado usando Seaborn según el example
Puedo hacer que funcione el ejemplo anterior, sin embargo, la línea:
tips = sns.load_dataset("tips")
no se explica en absoluto. He localizado el archivo tips.csv, pero parece que no puedo encontrar la documentación adecuada sobre lo que load_dataset específicamente hace. Traté de crear mi propia csv y cargar esto, pero fue en vano. También cambié el nombre del archivo de consejos y aún funcionaba ...
Mi pregunta es así:
¿Dónde está load_dataset
realmente buscando archivos? ¿Puedo usar esto para mis propios diagramas de caja?
EDITAR: DataFrame
hacer funcionar mis propios diagramas de DataFrame
usando mi propio DataFrame
, pero aún me pregunto si load_dataset
se usa para algo más que misteriosos ejemplos de tutoriales.
Descargue todos los archivos csv (comprimidos) que se usarán para su example desde https://github.com/mwaskom/seaborn-data .
Extraiga el archivo zip en un directorio local e inicie su cuaderno jupyter desde el mismo directorio. Ejecuta los siguientes comandos en el cuaderno jupyter:
import pandas as pd
tips = pd.read_csv(''seaborn-data-master/tips.csv'')
eres bueno para trabajar con tu ejemplo ahora!
Solo para agregar a la respuesta de ''selwyth''.
import pandas as pd
Data=pd.read_csv(''Path/to/csv/')
Data.head(10)
Una vez que haya completado estos pasos con éxito. Ahora la trama realmente funciona así.
Digamos que quieres trazar un gráfico de barras.
sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.
Esto realmente funciona con cada trazado en Seaborn.
Además, no seremos elegibles para agregar nuestro propio conjunto de datos en Seaborn Git.
load_dataset
busca archivos csv en línea en https://github.com/mwaskom/seaborn-data . Aquí está el docstring:
Cargue un conjunto de datos desde el repositorio en línea (requiere internet).
Parámetros
name: str Nombre del conjunto de datos (
name
.csv en https://github.com/mwaskom/seaborn-data ). Puede obtener una lista de conjuntos de datos disponibles usando: func:get_dataset_names
kws: dict, opcional Pasado a pandas.read_csv
Si desea modificar ese conjunto de datos en línea o traer sus propios datos, es probable que tenga que usar pandas . load_dataset
realidad devuelve un objeto DataFrame
pandas, que puede confirmar con el type(tips)
.
Si ya ha creado sus propios datos en un archivo csv llamado, por ejemplo, tips2.csv, y los ha guardado en la misma ubicación que su script, use esto (después de instalar pandas) para cargarlo:
import pandas as pd
tips2 = pd.read_csv(''tips2.csv'')