varias superponer studio modificar lineas graficos graficas ejes r modeling reference

superponer - ¿Hay una referencia mejor para r fórmulas que? Formula?



superponer graficas en r (1)

Hay muchas formas redundantes, y en ocasiones conflictivas, de especificar fórmulas en R. ¿Existe una referencia exhaustiva pero concisa para asignar modelos conceptuales a la sintaxis R que la ?formula ?

Estoy interesado en una visión general, que incluye la sintaxis utilizada para especificar fórmulas en modelos no lineales y jerárquicos como glm , lmer , gam , earth , incluido ( / ) para anidar, efectos random y fixed en modelos mixtos, y s y te para splines, y otros encontrados en populares paquetes contribuidos.


R viene con varios manuales, a los que se puede acceder desde el menú "Ayuda" de vanilla R en la parte superior derecha cuando se ejecuta R y también en varios lugares en línea.

El capítulo 11 de " Una introducción a R " tiene un par de páginas sobre fórmulas, por ejemplo.

No sé si constituye un recurso "completo" pero cubre gran parte de lo que necesita saber sobre cómo funcionan las fórmulas.

* De hecho, casi todo lo que quizás el 95% de los usuarios alguna vez usará

La referencia canónica a las fórmulas en el lenguaje S podría ser

Chambers JM, y Hastie TJ, editores. (1992), Modelos estadísticos en S. Chapman & Hall, Londres.

Aunque el origen del enfoque proviene de

Wilkinson GN, y Rogers CE (1973). "Descripción simbólica de modelos factoriales para el análisis de varianza". Estadística aplicada , 22 , 392–399

Varios libros recientes relacionados con R discuten fórmulas, pero no sé si llamaría a alguno de ellos completo.

También hay numerosos recursos en línea (por ejemplo, here ) a menudo con una gran cantidad de información muy útil.

Dicho esto, una vez que te sientas cómodo con el uso de fórmulas en R y así tengas un contexto en el que se puedan colocar más conocimientos, la página de ayuda contiene una cantidad sorprendente de información (junto con otras páginas a las que se vincula). Es un poco terso y críptico, pero una vez que tenga la base más amplia de conocimiento de la forma particular de trabajar de R, puede ser bastante útil.

Es probable que las preguntas específicas relacionadas con las fórmulas R (dependiendo de su contenido) estén relacionadas con el tema, ya sea en o en CrossValidated. De hecho, hay algunas preguntas bastante avanzadas relacionadas con las fórmulas que se pueden encontrar ya (el uso de búsquedas como la [r] formula fructífera), y sería útil tener más preguntas de este tipo para ayudar a los usuarios que luchan con estos problemas; Si tienes preguntas específicas, te animo a que las hagas.

En cuanto a ''redundante'' y ''conflictivo'', supongo que te refieres al hecho de que hay más de una forma de especificar un modelo de no intercepción: y ~ . -1 y ~ . -1 y y ~ . +0 y ~ . +0 ambos funcionan, por ejemplo, pero en contextos ligeramente diferentes, cada uno tiene sentido.

Además, existe el error común de tener que aislar términos cuadráticos y de orden superior de la interfaz de la fórmula (para usar I(x^2) como predictor, por lo que se pasa de forma segura a la interfaz de la fórmula y sobrevive lo suficiente como para ser interpretado como un álgebra expresión). Nuevamente, una vez que se obtiene una imagen de lo que está sucediendo "detrás de la escena", parece una molestia mucho menor.

Ejemplos específicos de las cosas que acabo de mencionar:

lm(dist ~ . -1, data=cars) # "remove-intercept-term" form of no-intercept lm(dist ~ . +0, data=cars) # "make-intercept-zero" form of no-intercept lm(dist ~ speed + speed^2, data=cars) # doesn''t do what we want here lm(dist ~ speed + I(speed^2), data=cars) # gets us a quadratic term lm(dist ~ poly(speed,2), data=cars) # avoid potential multicollinearity

Estoy de acuerdo en que la interfaz de la fórmula podría al menos usar un poco de orientación adicional y mejores ejemplos en la ayuda de la ?formula