studio - superponer graficas en r
Comprender `scale` en R (2)
Intento entender la definición de scale
que proporciona R. Tengo datos ( mydata
) con los que quiero hacer un mapa de calor, y hay un sesgo positivo MUY fuerte. Creé un mapa de calor con un dendrograma tanto para la scale(mydata)
como para el log(my data)
, y los dendogramas son diferentes para ambos. ¿Por qué? ¿Qué significa escalar mis datos, frente a logaritmo, transformar mis datos? ¿Y cuál sería más apropiado si quisiera ver el dendrograma que ilustra la relación entre las columnas de mis datos?
¡Gracias por cualquier ayuda! He leído las definiciones, pero están gritando por mi cabeza.
No proporciona nada más que una estandarización de los datos. Los valores que crea se conocen bajo varios nombres diferentes, uno de ellos es z-scores ("Z" porque la distribución normal también se conoce como "distribución Z").
Más se puede encontrar aquí:
log
simplemente toma el logaritmo (base e
, por defecto) de cada elemento del vector.
scale
, con las configuraciones predeterminadas, calculará la media y la desviación estándar de todo el vector, luego "escalará" cada elemento por esos valores restando el promedio y dividiendo por el sd. (Si usa scale(x, scale=FALSE)
, solo restará la media pero no dividirá por la desviación estándar).
Tenga en cuenta que esto le dará los mismos valores
set.seed(1)
x <- runif(7)
# Manually scaling
(x - mean(x)) / sd(x)
scale(x)