python scipy scikits statsmodels

Paquete de estadísticas de Python: diferencia entre statsmodel y scipy.stats



scikits statsmodels (3)

Creo que el paquete de estadísticas es numpy / scipy. También funciona muy bien si desea trazar sus datos usando matplotlib. Sin embargo, por lo que sé, matplotlib no funciona con Python 3.x todavía.

Necesito algunos consejos sobre cómo seleccionar el paquete de estadísticas para Python. He hecho algunas búsquedas, pero no estoy seguro de si hago las cosas bien, específicamente sobre las diferencias entre statsmodels y scipy.stats.

Una cosa que sé es que aquellos con espacio de nombres de scikits son "ramas" específicas de scipy, y lo que solía ser scikits.statsmodels ahora se llama statsmodels. Por otro lado también hay scipy.stats. ¿Cuáles son las diferencias entre los dos y cuál es el paquete de estadísticas para Python?

Gracias.

--EDITAR--

Cambié el título porque algunas respuestas no están realmente relacionadas con la pregunta, y supongo que eso se debe a que el título no es lo suficientemente claro.


Intento usar pandas / statsmodels / scipy para mi trabajo diario, pero a veces esos paquetes son un poco cortos (¿LOESS, alguien?). El problema con el módulo RPy es (la última vez que verifiqué, al menos) que quiere una versión específica de R que no sea actual, mi instalación R es 2.16 (creo) y RPy quería 2.14. Entonces, o tienes que tener dos instalaciones paralelas de R, o tienes que bajar de categoría. (Si no tiene R instalada, puede instalar la versión correcta de R y usar RPy).

Entonces, cuando necesito algo que no está en pandas / statsmodels / scipy escribo scripts R, y los ejecuto con el módulo de subprocess . Esto me permite interactuar con R lo menos posible (que realmente no me gusta programar), pero todavía puedo aprovechar todo lo que R tiene de los paquetes de Python.

La lección es que nunca hay una solución para cualquier problema: tienes que reunir un montón de partes que te son útiles (y tal vez escribir algunas propias), de una manera que entiendas, para resolver problemas. (¡Los aficionados de R no estarán de acuerdo, por supuesto!)


Statsmodels tiene scipy.stats como una dependencia. Scipy.stats tiene todas las distribuciones de probabilidad y algunas pruebas estadísticas. Es más como código de biblioteca en la vena de numpy y scipy. Statsmodels, por otro lado, proporciona modelos estadísticos con un marco de fórmula similar a R y funciona con pandas DataFrames. También hay pruebas estadísticas, gráficos y un montón de funciones de ayuda en statsmodels. Realmente depende de lo que necesites, pero definitivamente no tienes que elegir uno. Tienen diferentes objetivos y fortalezas.