artificial-intelligence - sistemas - qué es el aprendizaje supervisado
¿Cuál es la diferencia entre el aprendizaje supervisado y el aprendizaje no supervisado? (23)
Aprendizaje automático supervisado
"El proceso de un algoritmo aprende del conjunto de datos de entrenamiento y predice el resultado".
Precisión de la salida prevista directamente proporcional a los datos de entrenamiento (longitud)
El aprendizaje supervisado es donde tiene las variables de entrada (x) (conjunto de datos de entrenamiento) y una variable de salida (Y) (conjunto de datos de prueba) y utiliza un algoritmo para aprender la función de mapeo desde la entrada hasta la salida.
Y = f(X)
Tipos principales:
- Clasificación (eje y discreto)
- Predictivo (eje y continuo)
Algoritmos:
Algoritmos de clasificación:
Neural Networks Naïve Bayes classifiers Fisher linear discriminant KNN Decision Tree Super Vector Machines
Algoritmos predictivos:
Nearest neighbor Linear Regression,Multi Regression
Áreas de aplicación:
- Clasificando correos electrónicos como spam
- Clasificación de si el paciente tiene enfermedad o no
Reconocimiento de voz
Predecir la selección de recursos humanos candidato particular o no
Predecir el precio del mercado de valores.
En términos de inteligencia artificial y aprendizaje automático, ¿cuál es la diferencia entre aprendizaje supervisado y no supervisado? ¿Puedes dar una explicación básica y fácil con un ejemplo?
Aprendizaje supervisado
Las aplicaciones en las que los datos de entrenamiento comprenden ejemplos de los vectores de entrada junto con sus vectores objetivo correspondientes se conocen como problemas de aprendizaje supervisado.
Aprendizaje sin supervisión
En otros problemas de reconocimiento de patrones, los datos de entrenamiento consisten en un conjunto de vectores de entrada x sin ningún valor objetivo correspondiente. El objetivo de estos problemas de aprendizaje no supervisados puede ser descubrir grupos de ejemplos similares dentro de los datos, donde se denomina agrupamiento
Reconocimiento de patrones y aprendizaje automático (Bishop, 2006)
Aprendizaje supervisado
Tienes entrada x y una salida de destino t. Entonces entrenas el algoritmo para generalizar las partes faltantes. Se supervisa porque se da el objetivo. Usted es el supervisor que indica el algoritmo: para el ejemplo x, debe generar t!
Aprendizaje sin supervisión
Aunque la segmentación, el agrupamiento y la compresión generalmente se cuentan en esta dirección, me resulta difícil encontrar una buena definición para ello.
Tomemos como ejemplo los auto-codificadores de compresión . Si bien solo tiene la entrada x dada, es el ingeniero humano el que le dice al algoritmo que el objetivo también es x. Entonces, en cierto sentido, esto no es diferente del aprendizaje supervisado.
Y para el agrupamiento y la segmentación, no estoy muy seguro de si realmente se ajusta a la definición de aprendizaje automático (ver otra pregunta ).
Aprendizaje supervisado: tienes datos etiquetados y tienes que aprender de eso. por ejemplo, datos de la casa junto con el precio y luego aprender a predecir el precio
Aprendizaje no supervisado: tiene que encontrar la tendencia y luego predecir, no se han dado etiquetas anteriores. por ejemplo, diferentes personas en la clase y luego viene una nueva persona, entonces a qué grupo pertenece este nuevo estudiante.
El aprendizaje supervisado es básicamente donde tiene variables de entrada (x) y variable de salida (y) y utiliza un algoritmo para aprender la función de mapeo desde la entrada hasta la salida. La razón por la que llamamos a esto como supervisado es porque el algoritmo aprende del conjunto de datos de entrenamiento, el algoritmo iterativamente hace predicciones sobre los datos de entrenamiento. Los supervisados tienen dos tipos de clasificación y regresión. La clasificación es cuando la variable de salida es una categoría como sí / no, verdadero / falso. La regresión es cuando la salida es valores reales como la altura de la persona, la temperatura, etc.
El aprendizaje supervisado por la ONU es donde solo tenemos datos de entrada (X) y no variables de salida. Esto se denomina aprendizaje no supervisado porque a diferencia del aprendizaje supervisado anterior, no hay respuestas correctas y no hay un maestro. Los algoritmos se dejan a sus propios dispositivos para descubrir y presentar la estructura interesante en los datos.
Los tipos de aprendizaje no supervisado son agrupación y asociación.
El aprendizaje supervisado es básicamente una técnica en la que los datos de entrenamiento de los que aprende la máquina ya están etiquetados, lo que supone un clasificador de número impar simple en el que ya ha clasificado los datos durante el entrenamiento. Por lo tanto, utiliza datos "etiquetados".
El aprendizaje no supervisado, por el contrario, es una técnica en la que la máquina por sí misma etiqueta los datos. O puede decir que es el caso cuando la máquina aprende por sí misma desde cero.
El aprendizaje supervisado puede etiquetar un nuevo elemento en una de las etiquetas capacitadas en función del aprendizaje durante la capacitación. Debe proporcionar un gran número de conjuntos de datos de entrenamiento, conjunto de datos de validación y conjunto de datos de prueba. Si proporciona vectores de imagen de píxeles con dígitos junto con datos de entrenamiento con etiquetas, entonces puede identificar los números.
El aprendizaje no supervisado no requiere conjuntos de datos de entrenamiento. En el aprendizaje no supervisado, puede agrupar elementos en diferentes grupos en función de la diferencia en los vectores de entrada. Si proporciona vectores de imagen de píxeles de dígitos y le pide que los clasifique en 10 categorías, puede hacerlo. Pero sí sabe cómo etiquetarlo, ya que no ha proporcionado etiquetas de capacitación.
En Aprendizaje supervisado sabemos cuáles deben ser las entradas y salidas. Por ejemplo, dado un conjunto de coches. Tenemos que descubrir cuáles rojos y cuáles azules.
Considerando que, el aprendizaje no supervisado es donde tenemos que encontrar la respuesta con muy poca o sin ninguna idea acerca de cómo debe ser la salida. Por ejemplo, un alumno podría ser capaz de construir un modelo que detecte cuando las personas sonríen basándose en la correlación de patrones faciales y palabras como "¿de qué estás sonriendo?".
En aprendizaje simple supervisado es un tipo de problema de aprendizaje automático en el que tenemos algunas etiquetas y al usar esas etiquetas implementamos algoritmos tales como regresión y clasificación. La clasificación se aplica donde nuestra salida es similar a 0 o 1, verdadero / falso, si no. y la regresión se aplica cuando se pone un valor real como una casa de precios
El aprendizaje no supervisado es un tipo de problema de aprendizaje automático en el que no tenemos etiquetas significa que solo tenemos algunos datos, datos no estructurados y tenemos que agrupar los datos (agrupación de datos) utilizando varios algoritmos no supervisados
Intentaré que sea sencillo.
Aprendizaje supervisado: en esta técnica de aprendizaje se nos da un conjunto de datos y el sistema ya conoce la salida correcta del conjunto de datos. Así que aquí nuestro sistema aprende prediciendo un valor propio. Luego realiza una verificación de precisión mediante el uso de una función de costo, para verificar qué tan cerca estaba su predicción a la producción real.
Aprendizaje no supervisado: En esto nos acercamos con poco o ningún conocimiento de cuál sería nuestro resultado. Entonces, en lugar de eso, derivamos la estructura de los datos donde no sabemos el efecto de la variable. Hacemos la estructura agrupando los datos en función de la relación entre la variable en los datos. Aquí no tenemos un feedback basado en nuestra predicción.
Por ejemplo, muy a menudo, entrenar una red neuronal es un aprendizaje supervisado: le está diciendo a la red a qué clase corresponde el vector de características que está alimentando.
La agrupación es un aprendizaje no supervisado: permite que el algoritmo decida cómo agrupar muestras en clases que comparten propiedades comunes.
Otro ejemplo de aprendizaje no supervisado son los mapas de auto organización de Kohonen .
Siempre he encontrado que la distinción entre aprendizaje supervisado y no supervisado es arbitraria y un poco confusa. No hay una distinción real entre los dos casos, sino que hay una serie de situaciones en las que un algoritmo puede tener más o menos "supervisión". La existencia de aprendizaje semi-supervisado es un ejemplo obvio donde la línea está borrosa.
Tiendo a pensar en la supervisión como una retroalimentación al algoritmo sobre qué soluciones deberían preferirse. Para una configuración supervisada tradicional, como la detección de spam, le dices al algoritmo "no cometas ningún error en el conjunto de entrenamiento" ; para una configuración tradicional no supervisada, como la agrupación en clúster, le dice al algoritmo que "los puntos que están cerca entre sí deben estar en el mismo clúster" . Da la casualidad de que, la primera forma de retroalimentación es mucho más específica que la última.
En resumen, cuando alguien dice ''supervisado'', piensa en la clasificación, cuando dice ''no supervisado'' piensa en agrupar y trata de no preocuparte demasiado por eso más allá de eso.
Te puedo dar un ejemplo.
Supongamos que necesita reconocer qué vehículo es un automóvil y cuál es una motocicleta.
En el caso de aprendizaje supervisado , su conjunto de datos de entrada (entrenamiento) debe estar etiquetado, es decir, para cada elemento de entrada en su conjunto de datos de entrada (entrenamiento), debe especificar si representa un automóvil o una motocicleta.
En el caso de aprendizaje no supervisado , no se etiquetan las entradas. El modelo no supervisado agrupa la entrada en clústeres basados, por ejemplo, en características / propiedades similares. Entonces, en este caso, no hay etiquetas como "auto".
Ya que hace esta pregunta muy básica, parece que vale la pena especificar qué es el Aprendizaje automático.
El aprendizaje automático es una clase de algoritmos que se basa en datos, es decir, a diferencia de los algoritmos "normales", son los datos los que "dicen" cuál es la "buena respuesta". Ejemplo: un hipotético algoritmo de aprendizaje no automático para la detección de rostros en imágenes trataría de definir qué es un rostro (disco redondo similar al color de la piel, con un área oscura donde espera los ojos, etc.). Un algoritmo de aprendizaje automático no tendría tal definición codificada, pero sería "aprender por ejemplos": mostrará varias imágenes de caras y no caras y un buen algoritmo eventualmente aprenderá y será capaz de predecir si es invisible o no. La imagen es una cara.
Este ejemplo particular de detección de rostros está supervisado , lo que significa que sus ejemplos deben estar etiquetados , o decir explícitamente cuáles son rostros y cuáles no.
En un algoritmo no supervisado , sus ejemplos no están etiquetados , es decir, no dice nada. Por supuesto, en tal caso, el algoritmo no puede "inventar" lo que es una cara, pero puede tratar de cluster los datos en diferentes grupos, por ejemplo, puede distinguir que las caras son muy diferentes de los paisajes, que son muy diferentes de los caballos.
Ya que otra respuesta lo menciona (aunque, de manera incorrecta): hay formas de supervisión "intermedias", es decir, aprendizaje semi-supervisado y activo . Técnicamente, estos son métodos supervisados en los que existe una forma "inteligente" de evitar un gran número de ejemplos etiquetados. En el aprendizaje activo, el algoritmo mismo decide qué cosa debes etiquetar (por ejemplo, puede estar bastante seguro sobre un paisaje y un caballo, pero podría pedirte que confirmes si un gorila es realmente la imagen de una cara). En el aprendizaje semi-supervisado, hay dos algoritmos diferentes que comienzan con los ejemplos etiquetados y luego se "cuentan" la forma en que piensan acerca de un gran número de datos sin etiquetar. De esta "discusión" aprenden.
Aprendizaje supervisado
En esto, cada patrón de entrada que se usa para entrenar la red está asociado con un patrón de salida, que es el objetivo o el patrón deseado. Se supone que un maestro está presente durante el proceso de aprendizaje, cuando se realiza una comparación entre la salida calculada de la red y la salida esperada correcta, para determinar el error. El error se puede usar para cambiar los parámetros de la red, lo que resulta en una mejora en el rendimiento.
Aprendizaje sin supervisión
En este método de aprendizaje, la salida de destino no se presenta a la red. Es como si no hubiera un maestro para presentar el patrón deseado y, por lo tanto, el sistema aprende por sí mismo al descubrir y adaptarse a las características estructurales en los patrones de entrada.
Aprendizaje automático: explora el estudio y la construcción de algoritmos que pueden aprender de y hacer predicciones sobre datos. Estos algoritmos operan construyendo un modelo a partir de entradas de ejemplo para hacer predicciones basadas en datos o decisiones expresadas como salidas, en lugar de seguir estrictamente estático Instrucciones del programa.
Aprendizaje supervisado: es la tarea de aprendizaje automático de inferir una función a partir de datos de entrenamiento etiquetados. Los datos de entrenamiento consisten en un conjunto de ejemplos de entrenamiento. En el aprendizaje supervisado, cada ejemplo es un par que consiste en un objeto de entrada (típicamente un vector) y un valor de salida deseado (también llamado señal de supervisión). Un algoritmo de aprendizaje supervisado analiza los datos de entrenamiento y produce una función inferida, que se puede utilizar para mapear nuevos ejemplos.
A la computadora se le presentan entradas de ejemplo y sus salidas deseadas, dadas por un "maestro", y el objetivo es aprender una regla general que asigne entradas a salidas. Específicamente, un algoritmo de aprendizaje supervisado toma un conjunto conocido de datos de entrada y respuestas conocidas a los datos (salida), y entrena un modelo para generar predicciones razonables para la respuesta a nuevos datos.
Aprendizaje no supervisado: es aprender sin un profesor. Una cosa básica que podría querer hacer con los datos es visualizarlos. Es la tarea de aprendizaje automático de inferir una función para describir una estructura oculta a partir de datos sin etiquetar. Dado que los ejemplos dados al alumno no están etiquetados, no hay señal de error o de recompensa para evaluar una solución potencial. Esto distingue el aprendizaje no supervisado del aprendizaje supervisado. El aprendizaje no supervisado utiliza procedimientos que intentan encontrar particiones naturales de patrones.
Con el aprendizaje no supervisado no hay retroalimentación basada en los resultados de la predicción, es decir, no hay un maestro que lo corrija. Bajo los métodos de aprendizaje no supervisados no se proporcionan ejemplos etiquetados y no hay una noción de los resultados durante el proceso de aprendizaje. Como resultado, depende del esquema / modelo de aprendizaje encontrar patrones o descubrir los grupos de los datos de entrada
Debe usar métodos de aprendizaje no supervisados cuando necesite una gran cantidad de datos para entrenar a sus modelos, y la voluntad y capacidad para experimentar y explorar, y por supuesto un desafío que no se resuelve bien a través de métodos más establecidos. Con supervisión no supervisada. es posible aprender modelos más grandes y complejos que con el aprendizaje supervisado. Here hay un buen ejemplo de ello.
.
Aprendizaje supervisado, dados los datos con una respuesta.
Dado el correo electrónico etiquetado como spam / no spam, aprenda un filtro de spam.
Dado un conjunto de datos de pacientes diagnosticados con diabetes o no, aprenda a clasificar a los pacientes nuevos como diabéticos o no.
El aprendizaje no supervisado, dados los datos sin respuesta, permite al PC agrupar las cosas.
Dado un conjunto de artículos de noticias que se encuentran en la web, agrúpelos en un conjunto de artículos sobre la misma historia.
Dada una base de datos de datos personalizados, descubra automáticamente segmentos de mercado y agrupe clientes en diferentes segmentos de mercado.
Aprendizaje supervisado: es una tarea de aprendizaje automático de inferir una función a partir de datos de entrenamiento etiquetados.
Aprendizaje no supervisado: es una tarea de aprendizaje automático de inferir una función para describir una estructura oculta a partir de datos "no etiquetados" (no se incluye una clasificación o categorización en las observaciones).
Aprendizaje supervisado :
Un algoritmo de aprendizaje supervisado analiza los datos de entrenamiento y produce una función inferida, que se puede utilizar para mapear nuevos ejemplos.
- Proporcionamos datos de capacitación y conocemos la salida correcta para una entrada determinada
- Conocemos la relación entre entrada y salida.
Categorías del problema:
Regresión: predice los resultados dentro de una salida continua => asigne variables de entrada a alguna función continua.
Ejemplo:
Dada una foto de una persona, predice su edad.
Clasificación: predecir resultados en una salida discreta => mapear variables de entrada en categorías discretas
Ejemplo:
¿Es este tumor canceroso?
Aprendizaje sin supervisión:
El aprendizaje no supervisado aprende de los datos de prueba que no se han etiquetado, clasificado o categorizado. El aprendizaje no supervisado identifica puntos en común en los datos y reacciona en función de la presencia o ausencia de dichos puntos en común en cada nueva pieza de datos.
Podemos derivar esta estructura agrupando los datos en función de las relaciones entre las variables en los datos.
No hay retroalimentación basada en los resultados de predicción.
Categorías del problema:
Agrupación en clúster: es la tarea de agrupar un conjunto de objetos de tal manera que los objetos en el mismo grupo (llamado agrupación) sean más similares (en cierto sentido) que los de otros grupos (agrupaciones)
Ejemplo:
Tome una colección de 1,000,000 de genes diferentes, y encuentre una manera de agrupar automáticamente estos genes en grupos que de alguna manera sean similares o estén relacionados por diferentes variables, como la duración de la vida, la ubicación, los roles, etc.
Referencias:
Aprendizaje supervisado : Usted proporciona datos de ejemplo etiquetados de forma diversa como entrada, junto con las respuestas correctas. Este algoritmo aprenderá de él y comenzará a predecir los resultados correctos basándose en las entradas posteriores. Ejemplo : Correo electrónico filtro de spam
Aprendizaje no supervisado : solo da datos y no dice nada, como etiquetas o respuestas correctas. El algoritmo analiza automáticamente los patrones en los datos. Ejemplo : Google Noticias
Aprendizaje supervisado
El aprendizaje supervisado se basa en la capacitación de una muestra de datos de la fuente de datos con la clasificación correcta ya asignada. Dichas técnicas se utilizan en modelos de feedforward o MultiLayer Perceptron (MLP). Estas MLP tienen tres características distintivas:
- Una o más capas de neuronas ocultas que no forman parte de las capas de entrada o salida de la red que permiten a la red aprender y resolver problemas complejos.
- La no linealidad reflejada en la actividad neuronal es diferenciable y,
- El modelo de interconexión de la red exhibe un alto grado de conectividad.
Estas características, junto con el aprendizaje a través de la formación, resuelven problemas difíciles y diversos. El aprendizaje a través de la capacitación en un modelo ANN supervisado también se conoce como algoritmo de propagación de errores. El algoritmo de aprendizaje de corrección de errores entrena la red basándose en las muestras de entrada-salida y encuentra la señal de error, que es la diferencia de la salida calculada y la salida deseada, y ajusta los pesos sinápticos de las neuronas que son proporcionales al producto del error. Señal y la instancia de entrada del peso sináptico. Basado en este principio, el aprendizaje de propagación de error ocurre en dos pasos:
Pase adelantado:
Aquí, el vector de entrada se presenta a la red. Esta señal de entrada se propaga hacia adelante, neurona por neurona a través de la red y emerge en el extremo de salida de la red como señal de salida: y(n) = φ(v(n))
donde v(n)
es el campo local inducido de una neurona definido por v(n) =Σ w(n)y(n).
La salida que se calcula en la capa de salida o (n) se compara con la respuesta deseada d(n)
y encuentra el error e(n)
para esa neurona. Los pesos sinápticos de la red durante este paso son los mismos.
Pase hacia atrás:
La señal de error que se origina en la neurona de salida de esa capa se propaga hacia atrás a través de la red. Esto calcula el gradiente local para cada neurona en cada capa y permite que los pesos sinápticos de la red sufran cambios de acuerdo con la regla delta como:
Δw(n) = η * δ(n) * y(n).
Este cálculo recursivo continúa, con el paso hacia adelante seguido por el paso hacia atrás para cada patrón de entrada hasta que la red converge.
El paradigma de aprendizaje supervisado de una ANN es eficiente y encuentra soluciones a varios problemas lineales y no lineales, como la clasificación, el control de la planta, el pronóstico, la predicción, la robótica, etc.
Aprendizaje sin supervisión
Las redes neuronales autoorganizadas aprenden utilizando un algoritmo de aprendizaje no supervisado para identificar patrones ocultos en datos de entrada sin etiquetar. Esto sin supervisión se refiere a la capacidad de aprender y organizar información sin proporcionar una señal de error para evaluar la solución potencial. La falta de dirección para el algoritmo de aprendizaje en el aprendizaje no supervisado puede ser ventajosa en algún momento, ya que permite al algoritmo mirar hacia atrás en busca de patrones que no se hayan considerado previamente. Las principales características de los mapas autoorganizados (SOM) son:
- Transforma un patrón de señal entrante de dimensión arbitraria en un mapa bidimensional o 2 y realiza esta transformación de forma adaptativa
- La red representa una estructura de avance hacia adelante con una sola capa computacional que consiste en neuronas organizadas en filas y columnas. En cada etapa de representación, cada señal de entrada se mantiene en su contexto adecuado y,
- Las neuronas que tratan con información estrechamente relacionada están muy juntas y se comunican a través de conexiones sinápticas.
La capa computacional también se denomina capa competitiva, ya que las neuronas en la capa compiten entre sí para activarse. Por lo tanto, este algoritmo de aprendizaje se llama algoritmo competitivo. El algoritmo no supervisado en SOM funciona en tres fases:
Fase de competición:
para cada patrón de entrada x
, presentado a la red, se calcula el producto interno con peso sináptico w
y las neuronas en la capa competitiva encuentran una función discriminante que induce la competencia entre las neuronas y el vector de peso sináptico que está cerca del vector de entrada en la red. La distancia euclidiana se anuncia como ganadora en la competición. Esa neurona se llama mejor neurona coincidente,
i.e. x = arg min ║x - w║.
Fase cooperativa:
la neurona ganadora determina el centro de un vecindario topológico h
de neuronas cooperantes. Esto se realiza mediante la interacción lateral d
entre las neuronas cooperativas. Esta vecindad topológica reduce su tamaño durante un período de tiempo.
Fase adaptativa:
permite a la neurona ganadora y sus neuronas vecinas aumentar sus valores individuales de la función discriminante en relación con el patrón de entrada a través de ajustes de peso sinápticos adecuados,
Δw = ηh(x)(x –w).
Tras la presentación repetida de los patrones de entrenamiento, los vectores de peso sináptico tienden a seguir la distribución de los patrones de entrada debido a la actualización del vecindario y, por lo tanto, ANN aprende sin supervisor.
El modelo autoorganizado representa naturalmente el comportamiento neurobiológico y, por lo tanto, se utiliza en muchas aplicaciones del mundo real, como agrupamiento, reconocimiento de voz, segmentación de texturas, codificación de vectores, etc.
El aprendizaje supervisado es cuando los datos con los que alimenta su algoritmo están "etiquetados" o "etiquetados", para ayudar a su lógica a tomar decisiones.
Ejemplo: filtrado de spam de Bayes, donde debe marcar un elemento como spam para refinar los resultados.
El aprendizaje no supervisado son tipos de algoritmos que intentan encontrar correlaciones sin ninguna entrada externa distinta de los datos sin procesar.
Ejemplo: algoritmos de agrupamiento de minería de datos.
En el aprendizaje supervisado, la entrada x
se proporciona con el resultado esperado y
(es decir, la salida que se supone que produce el modelo cuando la entrada es x
), que a menudo se denomina "clase" (o "etiqueta") de la entrada correspondiente x
.
En el aprendizaje no supervisado, no se proporciona la "clase" de un ejemplo x
. Por lo tanto, el aprendizaje no supervisado puede considerarse como encontrar "estructura oculta" en un conjunto de datos sin etiquetar.
Los enfoques para el aprendizaje supervisado incluyen:
Clasificación (1R, Naive Bayes, algoritmo de aprendizaje del árbol de decisiones, como ID3 CART, etc.)
Predicción de valor numérico
Los enfoques para el aprendizaje no supervisado incluyen:
Agrupación (K-medias, agrupación jerárquica)
Asociación de aprendizaje de la regla