database r webforms statistics

database - Recopilación de datos para estadísticas: de la web a una base de datos.



webforms statistics (4)

He realizado una investigación medial utilizando un formulario en línea (en realidad dos de ellos). Mis preguntas eran bastante discretas y particulares a la enfermedad que estaba investigando.

Anteriormente, en un proyecto relacionado, había creado dos o tres cuestionarios que se imprimieron y luego los sujetos y los cirujanos llenaron los formularios y nuestro coordinador de investigación los ingresaría en nuestra base de datos. Fue mucho trabajo con mucho espacio para el error. No me gusta. Los formularios en línea eran mucho mejores.

Utilicé SurveyGizmo y estuve feliz con él. Miré muchas opciones hace unos dos años. Google Forms no existía en ese momento. Fui con SurveryGizmo principalmente porque tenían una declaración (atestación) de que cumplían con HIPAA. No pude garantizar la seguridad, como las conexiones SSL con los otros sitios web. Sin embargo, para poder acceder a esa capacidad (conexiones https) tuve que comprar el nivel empresarial, aunque en todas las demás funciones podría haber utilizado el servicio gratuito. Además, SurveyGizmo ofreció una reducción del 50% para organizaciones sin fines de lucro para las cuales calificó nuestro instituto de investigación.

SurveryGizmo fue fácil de diseñar y poner en producción sin tener que programarme. Fue fácil descargar los datos en formato CSV y leerlos directamente en R. Aunque tuve algunos problemas extraños con los que necesitaba ayuda. Tuve que usar el formato "antiguo" para exportar para que fuera un archivo csv directo. Además, el archivo csv tenía la característica impar de que las primeras DOS filas eran filas de encabezado. Pero resolví ese problema con la ayuda de stackoverflow .

SurveryGizmo tiene una lógica y una línea fantásticas que me permitieron solo hacer preguntas relevantes y, por lo tanto, no perder el tiempo de mis encuestados y, lo que es más importante, no hubo preguntas irrelevantes para confundir a los encuestados.

Finalmente, pude usar SurveyGizmo de tal manera que también pude seguir nuestro cumplimiento y logística (personal de investigación). Por ejemplo, recibimos una notificación cuando había nuevos sujetos potenciales que estaban interesados ​​en participar. Pudimos anotar los números de seguimiento de FedEx junto con los registros de los temas correspondientes.

Básicamente funcionó bien.

Soy un estadístico de comercio y me gustaría algunas recomendaciones sobre cómo configurar un sitio web que pueda recopilar datos en una base de datos. Para uso personal, utilizo los Formularios de Google para recopilar datos y todo se rellena en una hoja de cálculo. Sin embargo, esto puede no ser apropiado en un entorno más profesional, especialmente cuando tenemos varias páginas / formularios. Me imagino dos usos:

  1. Un sitio web donde puedo enviar el enlace a otros para que puedan completar, similar a los formularios de Google.
  2. Un sitio web donde solo los usuarios autorizados pueden iniciar sesión para completar los datos. Piense en un entorno donde los pacientes sean seguidos periódicamente en un estudio de investigación. Sería genial que el médico ingrese los datos directamente en la base de datos, ya que él / ella completa los formularios en lugar de que otro analista de datos transcriba sus formularios escritos en la base de datos.

La solución obvia sería contratar a un desarrollador web. Sin embargo, me gusta hacer las cosas yo mismo cuando son manejables. Me imagino que un desarrollador web debería conocer conocimientos de html, php y bases de datos (por ejemplo, MySQL o PostgreSQL). Mi experiencia en esto se limita a configurar un blog de WordPress en mi servidor Linux. Mi experiencia con html también está limitada ya que uso emacs org-mode para generarlos a partir de texto plano. Espero escuchar sobre soluciones con una curva de aprendizaje mínima. Por supuesto, mi preferencia sería un software de código abierto y basado en Linux, pero me gustaría escuchar todas las soluciones disponibles (nuestro administrador de datos es un usuario de Windows).

Recientemente leí una post en Linux Journal que menciona REDCap , pero parece que tienes que obtener un permiso institucional para usar.

También etiqueté "R" en esta publicación porque me gustaría saber qué hacen los usuarios de R con respecto a la recopilación de datos. Finalmente analizaré los datos con R, pero todo análisis de datos comienza con la pregunta científica y la recopilación de datos.

¡Gracias!

ACTUALIZACIÓN 10/4/2010: Gracias a todos por las respuestas hasta ahora. Parece que la mayoría de las soluciones de terceros propuestas hasta ahora tienen datos alojados en una base de datos alojada por el proveedor. Me gustaría alojar todos los datos en nuestro servidor SQL. Es decir, la entrada de datos desde la web ingresa a la base de datos en tiempo real, lista para el análisis de datos.


La plataforma más segura para recopilar datos confidenciales de la encuesta es Confirmit. Aquí hay una curva de aprendizaje: estará codificando en VisualSQL, que solo se usa en Confirmit. Las respuestas de la encuesta se exportarán a archivos csv, donde podrá analizar sus resultados en R.

Si está recopilando datos confidenciales, o datos en los que los encuestados necesitan enlaces de acceso únicos para que solo puedan ver su propia versión de la encuesta, querrá usar Confirmit. Los datos se encuentran en el centro de datos de Confirmit, pero sus datos son mucho más seguros que otros proveedores (es decir, un tercero no podrá piratear su encuesta y ver las respuestas de un individuo, o interceptar los datos que se le envían desde su respondiente a Confirmit).


Me parece que tienes un estudio de medicina. Hay una gran cantidad de preocupaciones que vienen a la mente solo por lo que has descrito que quieres hacer. No el menor de los cuales es la privacidad. ¿Dónde se va a alojar? ¿Ha recibido el consentimiento de los pacientes para recopilar y transmitir su información electrónicamente? ¿Qué datos está almacenando, si los hay, que podrían combinarse para presentar su identidad?

Personalmente, me alejo de las herramientas de recolección de datos en línea de bricolaje. Le pago a una empresa, como Ipsos, Research Now / E-Rewards, para programar y administrar la recopilación de datos mediante cuestionarios que he diseñado. La razón es que saber cómo diseñar investigaciones y analizar datos es una cosa. Pero si ha recibido capacitación en estadísticas, puedo argumentar con seguridad que "no sabe nada" sobre la recopilación de datos. Es probable que conozca la teoría del muestreo, pero cuando se trata de obtener datos, es mejor dejarlos en manos de los profesionales.

Hay una serie de herramientas de recopilación de datos en línea de "calidad industrial" disponibles.

  • Confirmit (prácticamente el estándar de oro para la recopilación de datos en línea)
  • DASH (seguimiento más pequeño, pero increíblemente flexible)

También hay soluciones basadas exclusivamente en la web, algunas de las cuales son gratuitas (no recomendaría su uso)

  • QuestionPro
  • Mono encuesta
  • Zoomerang

Aunque, a menos que esté realizando un estudio con más de 50 pacientes, solo recomendaría que los médicos o sus asistentes completen las hojas de Excel y las envíen a su compañero.

Además, es poco probable que necesite configurar un sistema de nombre de usuario / contraseña. Lo que desea se conoce como un "enlace abierto". Cuando los encuestados hacen clic en un enlace e ingresan información, el encuestado puede agregar la información del identificador. No necesita una contraseña porque las personas solo pueden ENTRAR información, no leerla.

La mayoría de los sistemas que mencioné anteriormente trabajan con la idea de enviar un correo electrónico a un encuestado (un clínico) con un enlace a una encuesta basada en la web. Que podría adaptarse fácilmente a sus necesidades específicas y actuar como un recordatorio para que el médico complete el formulario.

Si sus tipos de preguntas son simples. Estoy seguro de que podría contratar a un programador para armar un sitio web que tenga los formularios que necesita detrás de un front-end autorizado. PHP / MySQL probablemente haría el truco. Pero, antes de seguir adelante, revisaría las leyes de privacidad en su jurisdicción que rodea a la investigación médica.