ticks manipulation ggtitle ggplot change r statistics spss data-analysis

manipulation - Diferencia R y SPSS



ggplot title center (11)

@Henrik, hice la misma tarea que mencionaste ( C ++ y R ) en SPSS. Y resultó que SPSS es más rápido en comparación con R en este caso. En mi caso, SPSS es aprox. 7 veces más rápido. Estoy sorprendido por eso.

Aquí hay un código que utilicé en SPSS.

data list free /x (f8.3). begin data 1 end data. comp n = 1e6. comp t1 = $time. loop #rep = 1 to 10. comp x = 1. loop #i=1 to n. comp x = 1/(1+x). end loop. end loop. comp t2 = $time. comp elipsed = t2 - t1. form elipsed (f8.2). exe.

En breve analizaré una gran cantidad de datos relacionados con el tráfico de red y preprocesaré los datos para analizarlos. He descubierto que R y SPSS se encuentran entre las herramientas más populares para el análisis estadístico. También generaré muchos gráficos y tablas. Por lo tanto, me preguntaba cuál es la diferencia básica entre estos dos softwares.

No estoy preguntando cuál es mejor, solo quería saber cuál es la diferencia en términos de flujo de trabajo entre los dos (además del hecho de que SPSS tiene una GUI). En cualquier caso, trabajaré con guiones en ambos casos, así que quería saber sobre las otras diferencias.


Aquí hay algo que publiqué en la lista de correo de R-help hace un tiempo, pero creo que ofrece una buena descripción general de alto nivel de la diferencia general entre R y SPSS:

Cuando hablo de la facilidad de uso de los programas informáticos, me gusta la analogía entre automóviles y autobuses:

Los autobuses son muy fáciles de usar, solo necesita saber a qué autobús ir, a dónde subir y dónde bajarse (y debe pagar su tarifa). Los automóviles, por otro lado, requieren mucho más trabajo, necesitas tener algún tipo de mapa o indicaciones (incluso si el mapa está en tu cabeza), necesitas poner gasolina de vez en cuando, necesitas conocer las reglas del carretera (tiene algún tipo de licencia de conducir). La gran ventaja del automóvil es que puede llevarle a un montón de lugares donde el autobús no funciona y es más rápido para algunos viajes que requieren la transferencia entre los autobuses.

Al usar esta analogía, los programas como SPSS son buses, fáciles de usar para las cosas estándar, pero muy frustrantes si quiere hacer algo que no está preprogramado.

R es un SUV con tracción en las cuatro ruedas (aunque respetuoso con el medio ambiente) con una bicicleta en la parte posterior, un kayak en la parte superior, buenos zapatos para caminar y correr en el asiento del pasajero, y equipo de montañismo y espeleología en la parte posterior.

R puede llevarte a donde quieras ir si te tomas el tiempo de explicar cómo usar el equipo, pero eso llevará más tiempo que aprender dónde están las paradas en SPSS.

Hay GUI para R que hacen que sea un poco más fácil de usar, pero también limitan la funcionalidad que se puede usar tan fácilmente. SPSS tiene secuencias de comandos que lo llevan más allá de ser un simple bus, pero la filosofía general de SPSS dirige a las personas hacia la GUI en lugar de hacia los scripts.


Bueno, ¿eres un programador decente? Si es así, vale la pena aprender R. Puede hacer más con sus datos, tanto en términos de manipulación y modelado estadístico, que con SPSS, y sus gráficos también serán mejores. Por otro lado, si nunca has programado antes, o si te resulta intimidante la idea de pasar varios meses convirtiéndote en un programador, probablemente obtendrás más valor de SPSS. El nivel de cosas que puede hacer con R sin caer en su poder como un lenguaje de programación completo probablemente no justifique el esfuerzo.

Hay otra opción: colaborar. ¿Conoces a alguien con quien puedes trabajar en tu proyecto (no dices si es académico o industrial, pero de cualquier forma ...), quién sabe bien?


El flujo de trabajo inicial para SPSS implica justificar la escritura de un gran control de grasa. R está disponible gratuitamente.

R tiene un lenguaje único para ''guiones'', pero no piense de esa manera, R es realmente un lenguaje de programación con gran capacidad de manipulación de datos, estadísticas y gráficos incorporados. SPSS tiene ''Sintaxis'', ''Guiones'' y es también programable en Python.

Otra gran desventaja es que SPSS comprime sus datos en una estructura de tabla spreadsheety. Tratar con otras estructuras de datos es probablemente muy difícil, pero es algo natural para R. No sabría por dónde empezar a manejar los datos del tipo de gráfico de red en SPSS, pero hay un paquete para hacerlo para R.

También con R puedes integrar tu flujo de trabajo con tus informes mediante Sweave: escribes un documento con bits incrustados de código R que generan gráficos o tablas, ejecutas el archivo a través del sistema y sale el informe en formato PDF. Ideal para cuando quieres hacer un informe semanal, o haces un cuerpo de trabajo y luego el jefe te da un conjunto de datos actualizado. Vuelva a ejecutar, léalo, está hecho.

Pero tu sabes, tu llamada ...


Hay algunas excelentes respuestas arriba, pero intentaré proporcionar mis 2 centavos. Mi departamento depende completamente de SPSS para nuestro trabajo, pero en los últimos meses, he estado haciendo un esfuerzo consciente para aprender R; en parte, por algunas de las razones detalladas anteriormente (velocidad, estructuras de datos extensas, paquetes disponibles, etc.)

Dicho esto, aquí hay algunas cosas que he aprendido en el camino:

  1. A menos que tengas algo de experiencia en programación, creo que la creación de tablas de resumen en CTABLES destruye cualquier opción disponible en R. Hasta la fecha, no tengo conocimiento de que el paquete pueda replicar lo que se puede crear con Custom Tables.

  2. SPSS parece ser más lento al crear scripts, y sí, la sintaxis de SPSS es terrible. Dicho esto, he encontrado que los scipts en SPSS siempre se pueden mejorar pero usando el comando EXECUTE con moderación.

  3. SPSS y R pueden interactuar entre sí, aunque parece que es de una sola forma (solo cuando se usa R dentro de SPSS, y no al revés). Dicho esto, he encontrado que esto es de poca utilidad, aparte de si quiero usar ggplot2 o para algunas otras técnicas avanzadas de administración de datos. (Desprecio las macros de SPSS).

  4. Durante mucho tiempo sentí que el trabajo de "creación de informes" creado en SPSS es muy inferior a otras soluciones. Como se mencionó anteriormente, si puede aprovechar LaTex y Sweave, estará muy contento con sus flujos de trabajo eficientes.

  5. He podido hacer algunos análisis avanzados aprovechando OMS en SPSS. Casi todo se puede enrutar a un nuevo conjunto de datos, pero he descubierto que la mayoría de los usuarios de SPSS no usan esta funcionalidad. Además, al ver ejemplos en R, simplemente se siente "más fácil" que usar OMS.

En resumen, me encuentro usando SPSS cuando no puedo resolverlo rápidamente en R, pero sinceramente tengo toda la intención de alejarme de SPSS y usar R completamente en algún momento en el futuro cercano.



Mira este video por qué es bueno combinar SPSS y R ...

Link

Link

Si tiene instalada una copia compatible de R, puede conectarse a ella desde IBM SPSS Modeler y llevar a cabo la construcción del modelo y la puntuación del modelo utilizando algoritmos R personalizados que se pueden implementar en IBM SPSS Modeler. También debe tener una copia de IBM SPSS Modeler - Essentials for R instalada. IBM SPSS Modeler: Essentials for R le proporciona las herramientas que necesita para comenzar a desarrollar aplicaciones R personalizadas para su uso con IBM SPSS Modeler.


No tengo datos, pero según mi experiencia, puedo decirle una cosa:

SPSS es mucho más lento que R. (Y con mucho, realmente quiero decir mucho)

La magnitud de la diferencia es probablemente tan grande como la que existe entre C ++ y R.

Por ejemplo, nunca tengo que esperar más de un par de segundos en R. Utilizando SPSS y datos similares, tuve cálculos que tomaron más de 10 minutos.

Como una nota al margen no relacionada: a mis ojos, en la reciente discusión sobre la velocidad de R, este punto fue de alguna manera pasado por alto (es decir, la comparación con SPSS). Además, estoy asombrado de cómo esta discusión apareció por un tiempo y silenciosamente desapareció de nuevo.


SPSS proporciona una GUI para integrar fácilmente los programas R existentes o desarrollar otros nuevos. Para obtener más información, consulte la Comunidad de SPSS en IBM Developer Works.


Trabajo con ambos en una empresa y puedo decir lo siguiente:

  • Si tiene un gran equipo de personas diferentes (no todos los científicos de datos), SPSS es útil porque es sencillo (relativamente) de entender. Por ejemplo, si los usuarios van a ejecutar un modelo para obtener un resultado (estimaciones de ventas, etc.), SPSS es claro y fácil de usar.

Dicho esto, creo que R es mejor en casi cualquier otro sentido:

  • R es más rápido (aunque, a veces discutible)
  • Como se dijo anteriormente, la sintaxis en SPSS es horrible (no puedo enfatizar esto lo suficiente). Por otro lado, R puede ser doloroso de aprender, pero hay toneladas de recursos en línea y al final paga mucho más debido a las diferentes cosas que puedes hacer.
  • Una vez más, como todos los demás dicen, el cielo es el límite con R. Montones de paquetes, recursos y más importante: independencia para hacer lo que quieras. En mi organización tenemos algunas funciones de muy alto nivel que hacen mucho. La parte difícil es crearlos una vez, pero luego realizan tareas complicadas que SPSS enredaría en una telaraña interminable. Esto es especialmente cierto para cosas como bucles.

A menudo se pasa por alto, pero R también tiene muchas características para cooperar entre los equipos (integración de github con RStudio, y fácil creación de paquetes con devtools).

En realidad, si todos en su organización conocen R, todo lo que necesita es mantener un paquete básico en github para compartir todo. Esto, por supuesto, no es la norma, por lo que creo que SPSS, aunque es un peor producto, todavía tiene un mercado.


Trabajo en una compañía que usa SPSS para la mayoría de nuestro análisis de datos, y por una variedad de razones: he comenzado a usar R para cada vez más de mi propio análisis. Algunas de las mayores diferencias que he encontrado incluyen:

  1. Salida de tablas: SPSS tiene tablas básicas, tablas generales, tablas personalizadas, etc. que se envían a ese visor de datos ingenioso o como lo llamen. Estos pueden ser transportados con relativa facilidad a documentos de Word o hojas de Excel para su posterior análisis / presentación. La función equivalente en R implica aprender LaTex o usar un odfWeave o Lyx o algo de esa naturaleza.
  2. Etiquetado de datos -> SPSS hace un trabajo bastante bueno con las etiquetas de variables y las etiquetas de valores. No he encontrado una solución robusta para R para lograr esta misma tarea.
  3. Usted menciona que va a guionizar la mayor parte de su trabajo, y personalmente encuentro que la sintaxis de scripts de SPSS es absolutamente horrenda, hasta el punto de que he dejado de trabajar con SPSS siempre que sea posible. La sintaxis R parece mucho más lógica y sigue más de cerca los estándares de programación Y hay una comunidad muy activa de la que depender si se encuentra con problemas (SO por ejemplo). No he encontrado una buena comunidad de SPSS para hacer preguntas sobre cuándo tengo problemas.

Otros han señalado algunas de las grandes diferencias en términos de costo y funcionalidad de los programas. Si tiene que colaborar con otros, su nivel de comodidad con SPSS o R debe ser un factor, ya que no quiere ser el único en su grupo que pueda trabajar o editar un script que haya escrito en el futuro.

Si va a aprender R, esta publicación en el sitio web de intercambio de estadísticas tiene muchos recursos geniales para aprender R: https://stats.stackexchange.com/questions/138/resources-for-learning-r