ggplot2 - Introducción
ggplot2 es un paquete R que está diseñado especialmente para la visualización de datos y proporciona el mejor análisis exploratorio de datos. Proporciona tramas hermosas y sin complicaciones que se ocupan de detalles minuciosos, como dibujar leyendas y representarlas. Los gráficos se pueden crear de forma iterativa y editarlos más tarde. Este paquete está diseñado para funcionar en capas, comenzando con una capa que muestra los datos sin procesar recopilados durante el análisis de datos exploratorios con R y luego agregando capas de anotaciones y resúmenes estadísticos.
Incluso los usuarios de R más experimentados necesitan ayuda para crear gráficos elegantes. Esta biblioteca es una herramienta fenomenal para crear gráficos en R, pero incluso después de muchos años de uso casi diario, todavía necesitamos consultar nuestra Hoja de referencia.
Este paquete funciona bajo una gramática profunda llamada "Gramática de gráficos", que se compone de un conjunto de componentes independientes que se pueden crear de muchas formas. La “gramática de los gráficos” es la única razón que hace que ggplot2 sea muy poderoso porque el desarrollador de R no se limita a un conjunto de gráficos preespecificados que se utilizan en otros paquetes. La gramática incluye un conjunto simple de reglas y principios básicos.
En el año 2005, Wilkinson creó o más bien originó el concepto de gramática de gráficos para describir las características profundas que se incluyen entre todos los gráficos estadísticos. Se centra en la capa primaria que incluye la adaptación de características incrustadas con R.
Relación entre "Gramática de los gráficos" y R
Le dice al usuario o desarrollador que se utiliza un gráfico estadístico para mapear los datos con atributos estéticos como el color, la forma, el tamaño de los objetos geométricos en cuestión, como puntos, líneas y barras. El gráfico también puede contener varias transformaciones estadísticas de los datos en cuestión que se dibujan en el sistema de coordenadas mencionado. También incluye una función denominada "Facetado" que generalmente se utiliza para crear el mismo gráfico para diferentes subconjuntos del conjunto de datos mencionado. R incluye varios conjuntos de datos integrados. La combinación de estos componentes independientes comprende totalmente un gráfico particular.
Ahora centrémonos en diferentes tipos de tramas que se pueden crear con referencia a la gramática:
Datos
Si el usuario desea visualizar el conjunto dado de mapeos estéticos que describe cómo se mapean las variables requeridas en los datos para la creación de atributos estéticos mapeados.
Capas
Está compuesto por elementos geométricos y la transformación estadística requerida. Las capas incluyen objetos geométricos, geoms para datos cortos que realmente representan la trama con la ayuda de puntos, líneas, polígonos y muchos más. La mejor demostración es agrupar y contar las observaciones para crear el histograma específico para resumir la relación 2D de un modelo lineal específico.
Escamas
Las escalas se utilizan para mapear valores en el espacio de datos que se utiliza para la creación de valores, ya sea de color, tamaño y forma. Ayuda a dibujar una leyenda o ejes que se necesitan para proporcionar un mapeo inverso que hace posible leer los valores de datos originales de la gráfica mencionada.
Sistema coordinado
Describe cómo las coordenadas de datos se mapean juntas al plano mencionado del gráfico. También proporciona información de los ejes y las líneas de cuadrícula que se necesitan para leer el gráfico. Normalmente se utiliza como un sistema de coordenadas cartesianas que incluye coordenadas polares y proyecciones de mapas.
Facetas
Incluye especificaciones sobre cómo dividir los datos en subconjuntos necesarios y mostrar los subconjuntos como múltiplos de datos. Esto también se denomina proceso de acondicionamiento o enrejado.
Tema
Controla los puntos más finos de la visualización, como el tamaño de fuente y las propiedades del color de fondo. Para crear una trama atractiva, siempre es mejor considerar las referencias.
Ahora, también es igualmente importante discutir las limitaciones o características que la gramática no proporciona:
Carece de la sugerencia de qué gráficos deben usarse o qué le interesa hacer al usuario.
No describe la interactividad ya que solo incluye una descripción de gráficos estáticos. Para la creación de gráficos dinámicos se debe aplicar otra solución alternativa.
El gráfico simple creado con ggplot2 se menciona a continuación: