Manipulación de datos
Las métricas de software son un estándar de medida que contiene muchas actividades, lo que implica cierto grado de medición. El éxito en la medición del software radica en la calidad de los datos recopilados y analizados.
¿Qué son los buenos datos?
Los datos recopilados pueden considerarse como buenos datos, si pueden producir las respuestas a las siguientes preguntas:
Are they correct? - Un dato puede considerarse correcto, si fue recopilado de acuerdo con las reglas exactas de la definición de la métrica.
Are they accurate? - La precisión se refiere a la diferencia entre los datos y el valor real.
Are they appropriately precise? - La precisión se ocupa del número de decimales necesarios para expresar los datos.
Are they consistent? - Los datos pueden considerarse consistentes, si no muestran una diferencia importante de un dispositivo de medición a otro.
Are they associated with a particular activity or time period? - Si los datos están asociados con una actividad o período de tiempo en particular, entonces deben especificarse claramente en los datos.
Can they be replicated?- Normalmente, las investigaciones tales como encuestas, estudios de casos y experimentos se repiten con frecuencia en diferentes circunstancias. Por tanto, los datos también deberían poder reproducirse fácilmente.
¿Cómo definir los datos?
Los datos que se recopilan con fines de medición son de dos tipos:
Raw data- Los datos brutos son el resultado de la medición inicial de procesos, productos o recursos. Por ejemplo: hoja de tiempo semanal de los empleados de una organización.
Refined data - Los datos refinados resultan de la extracción de elementos de datos esenciales de los datos sin procesar para derivar valores para los atributos.
Los datos se pueden definir de acuerdo con los siguientes puntos:
- Location
- Timing
- Symptoms
- Resultado final
- Mechanism
- Cause
- Severity
- Cost
¿Cómo recopilar datos?
La recopilación de datos requiere observación e informes humanos. Los administradores, analistas de sistemas, programadores, evaluadores y usuarios deben registrar los datos de las filas en los formularios. Para recopilar datos precisos y completos, es importante:
Mantenga los procedimientos simples
Evite grabaciones innecesarias
Capacitar a los empleados en la necesidad de registrar datos y en los procedimientos que se utilizarán.
Proporcionar los resultados de la captura y el análisis de datos a los proveedores originales con prontitud y en una forma útil que los ayudará en su trabajo.
Validar todos los datos recopilados en un punto de recopilación central
La planificación de la recopilación de datos implica varios pasos:
Decidir qué productos medir según el análisis GQM
Asegúrese de que el producto esté bajo control de configuración
Decidir exactamente qué atributos medir y cómo se derivarán las medidas indirectas
Una vez que el conjunto de métricas esté claro y se haya identificado el conjunto de componentes que se medirán, elabore un esquema para identificar cada actividad involucrada en el proceso de medición.
Establecer un procedimiento para manejar los formularios, analizar los datos y reportar los resultados.
La planificación de la recopilación de datos debe comenzar cuando comienza la planificación del proyecto. La recopilación de datos real tiene lugar durante muchas fases de desarrollo.
For example - Algunos datos relacionados con el personal del proyecto se pueden recopilar al inicio del proyecto, mientras que la recopilación de otros datos, como el esfuerzo, comienza al inicio del proyecto y continúa durante la operación y el mantenimiento.
Cómo almacenar y extraer datos
En la ingeniería de software, los datos deben almacenarse en una base de datos y configurarse mediante un sistema de administración de bases de datos (DBMS). En la siguiente figura se muestra un ejemplo de una estructura de base de datos. Esta base de datos almacenará los detalles de diferentes empleados que trabajan en diferentes departamentos de una organización.
En el diagrama anterior, cada cuadro es una tabla en la base de datos, y la flecha denota la asignación de muchos a uno de una tabla a otra. Las asignaciones definen las restricciones que preservan la coherencia lógica de los datos.
Una vez que la base de datos está diseñada y poblada con datos, podemos hacer uso de los lenguajes de manipulación de datos para extraer los datos para su análisis.