Análisis de datos: descripción general

El análisis de datos es un proceso de inspección, limpieza, transformación y modelado de datos con el objetivo de descubrir información útil, sugerir conclusiones y respaldar la toma de decisiones.

.

Tipos de análisis de datos

Existen varias técnicas de análisis de datos que abarcan varios dominios como los negocios, la ciencia, las ciencias sociales, etc. con una variedad de nombres. Los principales enfoques de análisis de datos son:

  • Procesamiento de datos
  • Inteligencia de negocios
  • Análisis estadístico
  • Analítica predictiva
  • Análisis de texto

Procesamiento de datos

La minería de datos es el análisis de grandes cantidades de datos para extraer patrones de datos interesantes previamente desconocidos, datos inusuales y las dependencias. Tenga en cuenta que el objetivo es la extracción de patrones y conocimientos de grandes cantidades de datos y no la extracción de datos en sí.

El análisis de minería de datos involucra métodos informáticos en la intersección de los sistemas de inteligencia artificial, aprendizaje automático, estadísticas y bases de datos.

Los patrones obtenidos de la minería de datos se pueden considerar como un resumen de los datos de entrada que se pueden utilizar en análisis posteriores o para obtener resultados de predicción más precisos mediante un sistema de soporte de decisiones.

Inteligencia de negocios

Las técnicas y herramientas de Business Intelligence sirven para la adquisición y transformación de grandes cantidades de datos comerciales no estructurados para ayudar a identificar, desarrollar y crear nuevas oportunidades comerciales estratégicas.

El objetivo de la inteligencia empresarial es permitir una interpretación sencilla de grandes volúmenes de datos para identificar nuevas oportunidades. Ayuda a implementar una estrategia eficaz basada en conocimientos que pueden proporcionar a las empresas una ventaja competitiva en el mercado y estabilidad a largo plazo.

Análisis estadístico

La estadística es el estudio de la recopilación, análisis, interpretación, presentación y organización de datos.

En el análisis de datos, se utilizan dos metodologías estadísticas principales:

  • Descriptive statistics - En estadística descriptiva, los datos de toda la población o de una muestra se resumen con descriptores numéricos como:

    • Media, desviación estándar para datos continuos

    • Frecuencia, porcentaje de datos categóricos

  • Inferential statistics- Utiliza patrones en los datos de la muestra para hacer inferencias sobre la población representada o dar cuenta de la aleatoriedad. Estas inferencias pueden ser:

    • responder preguntas de sí / no sobre los datos (prueba de hipótesis)

    • estimar las características numéricas de los datos (estimación)

    • describir asociaciones dentro de los datos (correlación)

    • modelado de relaciones dentro de los datos (por ejemplo, análisis de regresión)

Analítica predictiva

El análisis predictivo utiliza modelos estadísticos para analizar datos actuales e históricos para realizar pronósticos (predicciones) sobre eventos futuros o desconocidos. En los negocios, el análisis predictivo se utiliza para identificar riesgos y oportunidades que ayudan en la toma de decisiones.

Análisis de texto

Text Analytics, también conocido como Text Mining o Text Data Mining es el proceso de derivar información de alta calidad a partir del texto. La minería de texto generalmente implica el proceso de estructurar el texto de entrada, derivar patrones dentro de los datos estructurados utilizando medios como el aprendizaje de patrones estadísticos y, finalmente, la evaluación e interpretación de la salida.

Proceso de análisis de datos

El análisis de datos es definido por el estadístico John Tukey en 1961 como "Procedimientos para analizar datos, técnicas para interpretar los resultados de dichos procedimientos, formas de planificar la recolección de datos para hacer su análisis más fácil, más preciso o más exacto, y toda la maquinaria y resultados de estadísticas (matemáticas) que se aplican al análisis de datos ".

Por lo tanto, el análisis de datos es un proceso para obtener datos grandes y no estructurados de varias fuentes y convertirlos en información útil para:

  • Respondiendo preguntas
  • Prueba de hipótesis
  • Decision-making
  • Refutando teorías

Análisis de datos con Excel

Microsoft Excel proporciona varios medios y formas de analizar e interpretar datos. Los datos pueden provenir de varias fuentes. Los datos se pueden convertir y formatear de varias formas. Se puede analizar con los comandos, funciones y herramientas relevantes de Excel, que incluyen formato condicional, rangos, tablas, funciones de texto, funciones de fecha, funciones de hora, funciones financieras, subtotales, análisis rápido, auditoría de fórmulas, herramienta de consulta, análisis hipotético, Solvers, modelo de datos, PowerPivot, PowerView, PowerMap, etc.

Aprenderá estas técnicas de análisis de datos con Excel como parte de dos partes:

  • Análisis de datos con Excel y
  • Análisis de datos avanzado con Excel