varias superponer studio lineas graficos graficas r statistics spss

superponer - datos de peso con R Parte II



superponer graficas en r (4)

Dado es el siguiente marco de datos:

structure(list(UH6401 = c(1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1), UH6402 = c(1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1), UH6403 = c(1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 1, 0, 1, 1), UH6404 = c(0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 1, 0, 1, 1), UH6409 = c(1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0 ), UH6410 = c(1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0 ), UH6411 = c(0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 0, 0, 1 ), UH6412 = c(1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1 ), UH6503 = c(1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1 ), UH66 = c(1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1), UH68 = c(0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0), UH6501a = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1), UH6405a = c(1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1), UH6407a = c(1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1), weight = c(405.002592353822, 479.360356183825, 526.548105855472, 810.005184707644, 312.321528531308, 930.961115757095, 567.383058387095, 475.323944260643, 1226.91439266118, 517.086839792615, 1200.2669656949, 810.005184707644, 656.723784884795, 605.370463928298, 668.467435759576, 558.112457492436, 793.751055244424, 479.360356183825, 1226.91439266118, 1606.54816212786, 1657.48609449633, 300.803580980276, 605.370463928298, 1140.55078447979, 669.102760422943, 810.005184707644, 1657.48609449633, 305.569853371963, 2994.30343152033, 762.922030382216, 479.360356183825, 1147.36030437824, 668.467435759576, 517.086839792615, 479.360356183825, 399.141865860217, 656.723784884795, 913.364738988386, 312.321528531308, 569.10576379231, 775.630259688922, 1207.22952429547, 1053.09621171094, 1140.55078447979, 314.857225320909, 668.467435759576, 2416.57081451012, 573.680152189121, 396.875527622212, 605.370463928298, 1036.3159447043, 3088.62283807823, 569.10576379231, 1140.55078447979, 2416.57081451012, 1147.36030437824, 762.922030382216, 702.064141140629, 351.032070570315, 629.714450641817, 517.086839792615, 1996.20228768022, 828.743047248167, 475.323944260643, 920.185794495882, 793.751055244424, 796.08788273764, 1197.42559758065, 405.002592353822, 418.584343119327, 300.803580980276, 654.76828203733, 2740.09421696516, 351.032070570315, 1069.6202614693, 2094.91447516374, 399.141865860217, 654.76828203733, 1003.65414063441, 573.680152189121, 851.074587580641, 913.364738988386, 762.922030382216, 1034.17367958523, 573.680152189121, 479.360356183825, 3208.8607844079, 654.76828203733, 908.055695892447, 328.361892442398, 1036.3159447043, 702.064141140629, 613.457196330588, 601.607161960551, 567.383058387095, 479.360356183825, 306.261087672466, 920.185794495882, 654.76828203733, 828.743047248167)), .Names = c("UH6401", "UH6402", "UH6403", "UH6404", "UH6409", "UH6410", "UH6411", "UH6412", "UH6503", "UH66", "UH68", "UH6501a", "UH6405a", "UH6407a", "weight" ), row.names = c(NA, 100L), class = "data.frame")

En las ciencias sociales a menudo tenemos una variable de ponderación para ponderar un caso (fila) por el factor de esa variable para corregir la muestra para que se ajuste, por ejemplo, a la población por clases de edad. Si la variable de peso de una fila es "1.6", significa que esta fila debe observarse 1.6 veces para ajustarse a la población base.

En SPSS escribiría

WEIGHT BY weight.

y todos los procedimientos posteriores a ese comando ponderarán los datos en consecuencia.

En RI puedo hacer eso con puñaladas con el comando

xtabs(weight ~ UH6401, data=df)

Pero, ¿y si quiero hacer un análisis SVD o PCA? Aquí no hay función para ponderar datos como en xtabs.

Entonces la pregunta es, ¿hay un método para ponderar datos en R como es posible en SPSS? El punto con números enteros sería fácil, con el factor "2" duplicaríamos la línea, pero ¿qué pasa con todos los factores que son decimales?

ACTUALIZAR:

¡La SVD o PCA fue solo un ejemplo! Toma cualquier otro procedimiento estadístico. En ciencias sociales, las muestras nunca son perfectas, pero para hacer un análisis estadístico con datos de muestra, la muestra necesita representar a la población básica, pero una muestra no lo hace en su mayoría. Así que tratamos de arreglar ese déficit con pesos, ¡así que la muestra representa la población básica!


En primer lugar, hacer PCA con estos datos no tiene sentido. En segundo lugar, SPSS no realiza PCA sino análisis factorial, que es otra cosa. Sé que lo llaman PCA, pero no lo es.

El WEIGHT BY en SPSS no es más que un peso de replicación, y es exactamente lo mismo que hacer su análisis al repetir sus casos usando rep() : completa locura. Para vincular a su ejemplo: en SPSS, FACTOR (que se utiliza para el llamado PCA) no toma pesos fraccionarios.

Si desea realizar procedimientos ponderados, la única forma sensata de hacerlo es usar el método / función / paquete correcto para eso. En estadísticas, no existe un procedimiento de peso para todos, al contrario de lo que a SPSS le gusta hacer creer.

En su ejemplo: PCA ponderado en R está contenido en FactoMineR y aroma.light . Pero sugiero que también eche un vistazo al paquete vegano , ya que contiene muchos más métodos de ordenación útiles para los datos que está describiendo.


Probablemente necesite familiarizarse con los motores de búsqueda de RSiteSearch and Rseek de R. Baron: este es uno de los primeros éxitos en "PCA ponderada" en el sitio de Baron:

http://finzi.psych.upenn.edu/R/library/aroma.light/html/wpca.matrix.html

Con la aclaración en el comentario a la respuesta de Joris Meys, la respuesta a menudo es que uno debe tener claro que se desea pesas de muestra versus otros tipos de ponderación. La ponderación de regresión se realiza con el paquete de survey . El libro de Lumley sobre métodos de encuestas distingue tres tipos de pesos. (Los "pesos" en la función lm son pesos de varianza, NO pesos de muestra).

Nota: Tanto el PCA como el análisis factorial (experimental) están incluidos en el paquete de la encuesta. Entonces, tal vez la pregunta de Dominick sobre un enfoque unificado para ponderar en los métodos de regresión tenga una única "respuesta".


No estoy seguro de que esto te sirva. Ver los pesos del paquete R


Acabo de encontrar una publicación en R-Bloggers que presenta una función svydesign() . Hasta donde yo sé, esta función del Paquete de encuestas es como la función SPSS, le permite crear una información ponderada para usar en un análisis posterior. Lo encuentro más útil que usar diferentes funciones de varios paquetes para hacer análisis multivariable. Espero que encuentres útil!

Otro analista de ciencias sociales que usa R;)