supervisados sistemas refuerzo por maquinas machine learning las español ensayo ejemplos como automatico aprendizaje aprenden algoritmos machine-learning deep-learning data-mining supervised-learning unsupervised-learning

machine-learning - sistemas - machine learning español pdf



¿Alguien puede dar un ejemplo real de aprendizaje supervisado y aprendizaje sin supervisión? (6)

Recientemente estudié sobre el aprendizaje supervisado y el aprendizaje no supervisado. Desde la teoría, sé que supervisar significa obtener la información de conjuntos de datos etiquetados y medios no supervisados, agrupando los datos sin ninguna etiqueta.

Pero, el problema es que siempre me confundo para identificar si el ejemplo dado es el aprendizaje supervisado o el aprendizaje no supervisado durante mis estudios.

¿Alguien puede por favor dar un ejemplo de la vida real?


Aprendizaje supervisado:

  • obtienes un montón de fotos con información sobre lo que hay en ellas y entrenas a un modelo para reconocer nuevas fotos
  • tienes un montón de moléculas e información que son drogas y entrenas a un modelo para que responda si la nueva molécula también es una droga

Aprendizaje sin supervisión:

  • tienes un montón de fotos de 6 personas, pero sin información, quién está en cuál y quieres dividir este conjunto de datos en 6 pilas, cada una con fotos de un individuo
  • usted tiene moléculas, parte de ellas son drogas y parte no lo son, pero usted no sabe cuáles son cuáles y usted quiere que el algoritmo descubra las drogas

Aprendizaje supervisado: en términos simples, tiene ciertas entradas y espera algunos resultados. Por ejemplo, tiene datos del mercado bursátil que son de datos previos y para obtener los resultados de la entrada actual para los próximos años, dando algunas instrucciones que le pueden dar el resultado necesario.

Aprendizaje no supervisado: usted tiene parámetros como el color, el tipo, el tamaño de algo y desea que un programa prediga si se trata de una fruta, una planta, un animal o lo que sea, aquí es donde interviene Supervisado. Le da salida al tomar algunos entradas.


Aprendizaje supervisado:

  • es como aprender con un maestro
  • el conjunto de datos de capacitación es como un maestro
  • el conjunto de datos de entrenamiento se usa para entrenar la máquina

Ejemplo:

Clasificación: la máquina está entrenada para clasificar algo en alguna clase.

  • clasificando si un paciente tiene una enfermedad o no
  • clasificando si un correo electrónico es spam o no

Regresión: la máquina está entrenada para predecir algún valor, como precio, peso o altura.

  • predicción de precio de la casa / propiedad
  • predecir el precio del mercado de valores

Aprendizaje sin supervisión:

  • es como aprender sin un maestro
  • la máquina aprende a través de la observación y encuentra estructuras en los datos

Ejemplo:

Agrupamiento: un problema de agrupamiento es donde desea descubrir las agrupaciones inherentes en los datos

  • como agrupar clientes por comportamiento de compra

Asociación: un problema de aprendizaje de reglas de asociación es donde desea descubrir reglas que describen grandes porciones de sus datos

  • como las personas que compran X también tienden a comprar Y

Leer más: Algoritmos de Aprendizaje Automático Supervisado y No Supervisado


Aprendizaje supervisado

Esto es simple y lo habría hecho varias veces, por ejemplo:

  1. Cortana o cualquier sistema automatizado de voz en su teléfono móvil entrena su voz y luego comienza a trabajar en función de este entrenamiento.
  2. Basado en varias características (registro anterior de enfrentamiento, lanzamiento, lanzamiento, jugador contra jugador) WASP predice el% ganador de ambos equipos.
  3. Entrene su escritura al sistema OCR y una vez entrenado, podrá convertir sus imágenes escritas a mano en texto (hasta cierta precisión, obviamente)
  4. Según algunos conocimientos previos (cuando el sol está soleado, la temperatura es más alta, cuando está nublado, la humedad es más alta, etc.) las aplicaciones meteorológicas predicen los parámetros para un tiempo determinado.
  5. Basado en información pasada sobre spams, filtrado de un nuevo correo electrónico entrante a Inbox (normal) o carpeta de correo basura (Spam)

  6. Asistencia biométrica o sistemas ATM, etc., donde se entrena la máquina después de un par de entradas (de su identidad biométrica, ya sea pulgar, iris o lóbulo de la oreja, etc.), la máquina puede validar su entrada futura e identificarlo.

Aprendizaje sin supervisión

  1. Un amigo te invita a su fiesta donde te encuentras totalmente extraños. Ahora los clasificará utilizando el aprendizaje no supervisado (sin conocimiento previo) y esta clasificación puede basarse en el género, el grupo de edad, el vestuario, la calificación educativa o cualquier otra forma que desee. ¿Por qué este aprendizaje es diferente del aprendizaje supervisado? Dado que no usó ningún conocimiento pasado / previo sobre personas y las clasificó como "en camino".

  2. La NASA descubre nuevos cuerpos celestes y los encuentra diferentes de objetos astronómicos previamente conocidos: estrellas, planetas, asteroides, agujeros negros, etc. (es decir, no tiene conocimiento de estos nuevos cuerpos) y los clasifica de la manera que le gustaría (distancia de la Vía Láctea, intensidad, fuerza gravitacional, turno rojo / azul o lo que sea)

  3. Supongamos que nunca antes ha visto un partido de Cricket y, por casualidad, mira un video en Internet, ahora puede clasificar jugadores según un criterio diferente: los jugadores que usan el mismo tipo de kits están en una sola clase. Los jugadores de un estilo están en una sola clase (bateadores, jugador de bolos, fildeadores), o sobre la base de jugar la mano (RH vs LH) o de la forma en que lo observaría [y clasificaría].

  4. Estamos llevando a cabo una encuesta de 500 preguntas sobre cómo predecir el nivel de IQ de los estudiantes en una universidad. Como este cuestionario es demasiado grande, después de 100 estudiantes, la administración decide recortar el cuestionario a un menor número de preguntas y para ello usamos algún procedimiento estadístico como PCA para recortarlo.

Espero que estos dos ejemplos expliquen la diferencia en detalle.


Aprendizaje supervisado

El aprendizaje supervisado es bastante común en los problemas de clasificación porque el objetivo suele ser lograr que la computadora aprenda un sistema de clasificación que hemos creado. El reconocimiento de dígitos, una vez más, es un ejemplo común de aprendizaje de clasificación. De manera más general, el aprendizaje de la clasificación es apropiado para cualquier problema donde la deducción de una clasificación es útil y la clasificación es fácil de determinar. En algunos casos, tal vez ni siquiera sea necesario dar clasificaciones predeterminadas a cada instancia de un problema si el agente puede resolver las clasificaciones por sí mismo. Este sería un ejemplo de aprendizaje no supervisado en un contexto de clasificación.

El aprendizaje supervisado es la técnica más común para el entrenamiento de redes neuronales y árboles de decisión. Ambas técnicas dependen en gran medida de la información dada por las clasificaciones predeterminadas. En el caso de las redes neuronales, la clasificación se utiliza para determinar el error de la red y luego ajustar la red para minimizarla, y en los árboles de decisión, las clasificaciones se utilizan para determinar qué atributos proporcionan la mayor cantidad de información que se puede usar para resolver el acertijo de clasificación Veremos ambos con más detalle, pero por ahora, debería ser suficiente saber que ambos ejemplos prosperan al tener cierta "supervisión" en forma de clasificaciones predeterminadas.

El reconocimiento de voz utilizando modelos ocultos de Markov y redes Bayesianas también se basa en algunos elementos de supervisión para ajustar los parámetros, como de costumbre, minimizar el error en las entradas dadas.

Observe algo importante aquí: en el problema de clasificación, el objetivo del algoritmo de aprendizaje es minimizar el error con respecto a las entradas dadas. Estas entradas, a menudo llamadas el "conjunto de entrenamiento", son los ejemplos de los cuales el agente intenta aprender. Pero aprender bien el entrenamiento no es necesariamente lo mejor que se puede hacer. Por ejemplo, si traté de enseñarle de manera exclusiva, o si solo le mostré combinaciones que consisten en una verdadera y una falsa, pero nunca tanto falsa o ambas verdaderas, podría aprender la regla de que la respuesta es siempre cierta. De manera similar, con los algoritmos de aprendizaje automático, un problema común es el exceso de ajuste de los datos y esencialmente la memorización del conjunto de entrenamiento en lugar de aprender una técnica de clasificación más general.

Aprendizaje sin supervisión

El aprendizaje no supervisado parece mucho más difícil: el objetivo es que la computadora aprenda a hacer algo que no le decimos cómo hacer. En realidad, hay dos enfoques para el aprendizaje no supervisado. El primer enfoque es enseñar al agente no mediante categorizaciones explícitas, sino mediante el uso de algún tipo de sistema de recompensa para indicar el éxito. Tenga en cuenta que este tipo de capacitación generalmente encajará en el marco del problema de decisión porque el objetivo no es producir una clasificación, sino tomar decisiones que maximicen las recompensas. Este enfoque generaliza bien al mundo real, donde los agentes pueden ser recompensados ​​por hacer ciertas acciones y castigados por hacer otras.

A menudo, se puede utilizar una forma de aprendizaje de refuerzo para el aprendizaje no supervisado, donde el agente basa sus acciones en las recompensas y castigos previos sin tener que aprender siquiera ninguna información sobre las formas exactas en que sus acciones afectan el mundo. En cierto modo, toda esta información es innecesaria porque, al aprender una función de recompensa, el agente simplemente sabe qué hacer sin ningún procesamiento porque sabe la recompensa exacta que espera lograr por cada acción que podría tomar. Esto puede ser extremadamente beneficioso en los casos en los que calcular todas las posibilidades lleva mucho tiempo (incluso si se conocieran todas las probabilidades de transición entre los estados del mundo). Por otro lado, puede llevar mucho tiempo aprender esencialmente por prueba y error.

Pero este tipo de aprendizaje puede ser poderoso porque no supone una clasificación de ejemplos predescubierta. En algunos casos, por ejemplo, nuestras clasificaciones pueden no ser las mejores posibles. Un ejemplo sorprendente es que la sabiduría convencional sobre el juego de backgammon se volvió en su cabeza cuando una serie de programas de computadora (neuro-gammon y TD-gammon) que aprendieron a través del aprendizaje no supervisado se hicieron más fuertes que los mejores jugadores de ajedrez meramente jugando ellos mismos una y otra vez. Estos programas descubrieron algunos principios que sorprendieron a los expertos en backgammon y funcionaron mejor que los programas de backgammon entrenados en ejemplos pre-clasificados.

Un segundo tipo de aprendizaje no supervisado se llama agrupamiento. En este tipo de aprendizaje, el objetivo no es maximizar una función de utilidad, sino simplemente buscar similitudes en los datos de capacitación. La suposición es a menudo que los conglomerados descubiertos coincidirán razonablemente bien con una clasificación intuitiva. Por ejemplo, la agrupación de individuos en función de la demografía puede dar lugar a una agrupación de los ricos en un grupo y los pobres en otro.


El aprendizaje supervisado tiene entrada y salida correcta. Por ejemplo: tenemos los datos si a una persona le gustó la película o no. Sobre la base de entrevistar a las personas y recabar su respuesta, si les gustó la película o no, vamos a predecir si la película será golpeada o no.

Veamos la imagen en el enlace de arriba. He visitado los restaurantes marcados con un círculo rojo. Los restaurantes que no he visitado están marcados con un círculo azul.

Ahora, si tengo dos restaurantes para elegir, A y B, marcados con un color verde, ¿cuál elegiré?

Sencillo. Podemos clasificar los datos dados linealmente en dos partes. Eso significa que podemos dibujar una línea que segrega el círculo rojo y azul. Mira la imagen en el siguiente enlace:

Ahora, podemos decir con cierta confianza que las probabilidades de que visite B sea mayor que A. Este es un caso de aprendizaje supervisado.

El aprendizaje no supervisado tiene entradas. Supongamos que tenemos un taxista que tiene la opción de aceptar o rechazar las reservas. Hemos trazado su ubicación de reserva aceptada en el mapa con un círculo azul y se muestra a continuación:

Ahora, el taxista tiene dos reservas A y B; ¿Cuál aceptará? Si observamos la trama, podemos ver que su reserva aceptada muestra un grupo en la esquina inferior izquierda. Eso se puede mostrar en la imagen a continuación: