software programa khan examples book and academy math statistics

math - khan - Herramientas estadísticas para programadores



statistics programa (11)

Estoy tratando de evaluar la compra de una herramienta estadística. Esto será utilizado en parte por usuarios que no están programando (haciendo estudios clínicos) y en parte por programadores, por lo que estoy tratando de encontrar un buen compromiso entre usabilidad y automatización. Por supuesto, el costo es un problema, pero si puedo construir un caso sólido, probablemente podríamos comprar un paquete comercial, por lo que no estamos totalmente limitados a las opciones gratuitas.

Hasta ahora, nuestras opciones son:

  • Statistica (que algunos no programadores ya saben)
  • Caja de herramientas de Matlab Statistics (los programadores ya usan matlab)
  • Lenguaje R (necesitaría una IU para no programadores)
  • Inserta algo en Excel (no es divertido, pero eso es lo que hacen los no programadores en este momento)
  • ? ...

¿Qué más hay? ¿Cuál es el estándar de la industria? ¿Qué tipo de características distintivas debería buscar? ¿Que recomendaria y porque?

Idealmente, nos gustaría una herramienta que pueda ejecutarse tanto en máquinas Linux como Windows.

(Trabajo en imagenología médica, por lo que hacemos tanto bioestadística como estadísticas de ingeniería de software)


Para un paquete estadístico con una GUI que los usuarios no técnicos pueden usar, le recomiendo que vaya con "SAS Enterprise Guide". Obtendrá los procedimientos SAS comunes y avanzados, una excelente facilidad gráfica y la capacidad de programar para los usuarios técnicos. Recomiendo que empiece con la "Edición de aprendizaje de SAS" ( http://support.sas.com/learn/le/ ), que es una versión completamente funcional de Enterprise Guide, pero limitada a procesar 1000 filas a la vez. Es menos de $ 500, lo que lo convierte en un buen trato.


Considera Excel una vez más. Es bien conocido y ampliamente disponible. Consulte este libro o este libro .


Indiscutiblemente es R. R es muy amigable con los programadores. Tiene aspectos funcionales y es GNU.

S-PLUS y R están ambos basados ​​en el lenguaje S. Ambos son similares y en la mayoría de los casos puede ejecutar como programa S-PLUS en R y viceversa.

SAS es otra opción, aunque orientada más hacia BI y empresas. SAS tiene una sintaxis más simple que R y, en mi opinión, es más fácil de recuperar para un no programador.

Otras opciones incluyen SPSS, Matlab e incluso Excel.


Recomiendo R, personalmente. Es utilizado por bioinformáticos y psicólogos, oí. No sé cuál es tu campo, así que tal vez sea una mala elección. Es razonablemente fácil de usar y aprender.


Yo miraría a S-Plus .

Obtiene un entorno de programación fuerte (S-Plus Workbench, basado en la plataforma Eclipse), una GUI intuitiva para los no programadores y una amplia comunidad de usuarios (incluidos los usuarios de R, que se basó en la S original).


Stata y SPSS tienden a ser los paquetes más comúnmente utilizados en estudios clínicos. Ambos son bastante fáciles de usar y de usar para personas que no tienen una mentalidad técnica, pero en general son lo suficientemente flexibles. He usado Stata más que cualquiera de los otros y he estado muy contento con sus opciones (admite operaciones basadas en menús y en línea de comandos, un sistema de complementos suficientemente bueno para obtener nuevos módulos creados por los usuarios, buen soporte de gráficos).

R es un poco más desalentador para los usuarios novatos, aunque es popular entre los bioestadísticos. Como es gratis, ese es otro buen punto a su favor.



Parece que estás tratando de maximizar múltiples objetivos. Usted dice "Esto será utilizado en parte por usuarios que no están programando (haciendo estudios clínicos) y en parte por programadores, así que estoy tratando de encontrar un buen compromiso entre la usabilidad y la automatización", con una suposición implícita de que este será el misma herramienta en ambos casos, cuando eso podría no ser realista. ¿Cuál es el compromiso de Word y LaTeX, por ejemplo?

Algunas preguntas diferentes sobre los requisitos:

  • ¿Debería ser extensible para programadores?
    • Capaz de usar extensiones C
    • Fácil de hacer nuevos procedimientos y métodos
  • ¿Qué análisis van a querer usar los no programadores?
  • ¿Gráficos?
  • Facilidad de uso para diferentes grupos

Así que mi lectura sobre esto:

Fácil de extender: R / S-plus, Matlab / Octave (prefiero R, pero hago más estadísticas y menos elementos de matriz) Fácil de usar para personas normales: Excel, R personalizado, SPSS

Además, R on windows tiene una GUI limitada, que puede o no ayudar a sus usuarios.

Si fuera yo, iría con una solución híbrida. Utilice R y proporcione una hoja de trucos para tareas comunes a los no programadores que ilustren tareas comunes, o mejor aún, escriban algunas funciones de contenedor con nombres como "image_summary" que automaticen su trabajo de exploración.

Para escribir scripts de front-end para R, los envoltorios de python RPy también pueden ser de ayuda.


Esta página de Wikipedia compara las funciones disponibles para varios paquetes estadísticos, así como su compatibilidad con el sistema operativo y la información de precios (que parece un poco desactualizada, pero da una idea general)


SAS Enterprise Guide tiene una buena usabilidad para los no programadores. Además, tiene buenas opciones para conectarse a Excel. Y para los programadores, es la opción más robusta que existe. El servidor sas se ejecuta en cualquier cosa, sin embargo, la guía empresarial es solo de Windows.


Terminamos obteniendo la caja de herramientas de estadísticas de Matlab (principalmente porque ya teníamos cierta experiencia con Matlab en el equipo, y necesitábamos la herramienta de todos modos)

Hasta ahora, está haciendo lo que tenemos que hacer, y es fácilmente expansible. El uso se mostrará si los programadores no lo usan realmente, pero hasta ahora se ve bien.