tutorial sns python boxplot seaborn

python - sns - seaborn vs matplotlib



Seaborn load_dataset (3)

Estoy intentando hacer un diagrama de caja agrupado usando Seaborn según el example

Puedo hacer que funcione el ejemplo anterior, sin embargo, la línea:

tips = sns.load_dataset("tips")

no se explica en absoluto. He localizado el archivo tips.csv, pero parece que no puedo encontrar la documentación adecuada sobre lo que load_dataset específicamente hace. Traté de crear mi propia csv y cargar esto, pero fue en vano. También cambié el nombre del archivo de consejos y aún funcionaba ...

Mi pregunta es así:

¿Dónde está load_dataset realmente buscando archivos? ¿Puedo usar esto para mis propios diagramas de caja?

EDITAR: DataFrame hacer funcionar mis propios diagramas de DataFrame usando mi propio DataFrame , pero aún me pregunto si load_dataset se usa para algo más que misteriosos ejemplos de tutoriales.


Descargue todos los archivos csv (comprimidos) que se usarán para su example desde https://github.com/mwaskom/seaborn-data .

Extraiga el archivo zip en un directorio local e inicie su cuaderno jupyter desde el mismo directorio. Ejecuta los siguientes comandos en el cuaderno jupyter:

import pandas as pd tips = pd.read_csv(''seaborn-data-master/tips.csv'')

eres bueno para trabajar con tu ejemplo ahora!


Solo para agregar a la respuesta de ''selwyth''.

import pandas as pd Data=pd.read_csv(''Path/to/csv/') Data.head(10)

Una vez que haya completado estos pasos con éxito. Ahora la trama realmente funciona así.

Digamos que quieres trazar un gráfico de barras.

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.

Esto realmente funciona con cada trazado en Seaborn.

Además, no seremos elegibles para agregar nuestro propio conjunto de datos en Seaborn Git.


load_dataset busca archivos csv en línea en https://github.com/mwaskom/seaborn-data . Aquí está el docstring:

Cargue un conjunto de datos desde el repositorio en línea (requiere internet).

Parámetros

name: str Nombre del conjunto de datos ( name .csv en https://github.com/mwaskom/seaborn-data ). Puede obtener una lista de conjuntos de datos disponibles usando: func: get_dataset_names

kws: dict, opcional Pasado a pandas.read_csv

Si desea modificar ese conjunto de datos en línea o traer sus propios datos, es probable que tenga que usar pandas . load_dataset realidad devuelve un objeto DataFrame pandas, que puede confirmar con el type(tips) .

Si ya ha creado sus propios datos en un archivo csv llamado, por ejemplo, tips2.csv, y los ha guardado en la misma ubicación que su script, use esto (después de instalar pandas) para cargarlo:

import pandas as pd tips2 = pd.read_csv(''tips2.csv'')