Ciencia de datos ágil: función de las predicciones

En este capítulo, aprenderemos sobre el papel de las predicciones en la ciencia de datos ágil. Los informes interactivos exponen diferentes aspectos de los datos. Las predicciones forman la cuarta capa del sprint ágil.

Al hacer predicciones, siempre nos referimos a los datos pasados ​​y los usamos como inferencias para iteraciones futuras. En este proceso completo, pasamos los datos del procesamiento por lotes de datos históricos a datos en tiempo real sobre el futuro.

El papel de las predicciones incluye lo siguiente:

  • Las predicciones ayudan en la previsión. Algunos pronósticos se basan en inferencias estadísticas. Algunas de las predicciones se basan en opiniones de expertos.

  • La inferencia estadística está involucrada con predicciones de todo tipo.

  • A veces, los pronósticos son precisos, mientras que a veces los pronósticos son inexactos.

Analítica predictiva

El análisis predictivo incluye una variedad de técnicas estadísticas desde el modelado predictivo, el aprendizaje automático y la minería de datos que analizan hechos históricos y actuales para hacer predicciones sobre eventos futuros y desconocidos.

El análisis predictivo requiere datos de entrenamiento. Los datos entrenados incluyen características independientes y dependientes. Las características dependientes son los valores que un usuario intenta predecir. Las características independientes son características que describen las cosas que queremos predecir en función de las características dependientes.

El estudio de características se denomina ingeniería de características; esto es crucial para hacer predicciones. La visualización de datos y el análisis de datos exploratorios son parte de la ingeniería de características; Estos forman el núcleo deAgile data science.

Haciendo predicciones

Hay dos formas de hacer predicciones en la ciencia de datos ágil:

  • Regression

  • Classification

La creación de una regresión o una clasificación depende completamente de los requisitos comerciales y su análisis. La predicción de la variable continua conduce al modelo de regresión y la predicción de las variables categóricas conduce al modelo de clasificación.

Regresión

La regresión considera ejemplos que comprenden características y, por lo tanto, produce una salida numérica.

Clasificación

La clasificación toma la entrada y produce una clasificación categórica.

Note - El conjunto de datos de ejemplo que define la entrada para la predicción estadística y que permite que la máquina aprenda se denomina "datos de entrenamiento".