usar traduccion para machine learning español ensayo ejemplos dummies data como automatico aprendizaje aprender machine-learning data-mining

machine learning - traduccion - ¿Utiliza retroalimentación o refuerzo en el aprendizaje automático?



machine learning traduccion (3)

He utilizado estos comentarios para cada proyecto de aprendizaje automático en el que trabajé. Permite entrenar con menos datos (por lo tanto, el entrenamiento es más rápido) que seleccionando datos aleatoriamente. La precisión del modelo también se mejora más rápido que mediante el uso de datos de entrenamiento seleccionados al azar. Estoy trabajando en datos de procesamiento de imágenes (visión artificial), así que otro tipo de selección que estoy haciendo es agregar datos falsos (incorrectos) agrupados en lugar de agregar todos los datos falsos. Esto se debe a que supongo que siempre tendré algunos errores, por lo que mi definición de datos positivos es cuando está agrupada en la misma área de la imagen.

Estoy tratando de resolver algún problema de clasificación. Parece que muchos enfoques clásicos siguen un paradigma similar. Es decir, entrene un modelo con un conjunto de entrenamiento y utilícelo para predecir las etiquetas de clase para nuevas instancias.

Me pregunto si es posible introducir algún mecanismo de retroalimentación en el paradigma. En teoría de control, la introducción de un ciclo de retroalimentación es una forma efectiva de mejorar el rendimiento del sistema.

Actualmente, un enfoque directo en mi mente es, primero, comenzamos con un conjunto inicial de instancias y entrenamos un modelo con ellas. Luego, cada vez que el modelo hace una predicción incorrecta, agregamos la instancia incorrecta en el conjunto de entrenamiento. Esto es diferente de ampliar ciegamente el conjunto de entrenamiento porque es más focalizado. Esto puede verse como un tipo de retroalimentación negativa en el lenguaje de la teoría de control.

¿Hay alguna investigación con el enfoque de retroalimentación? ¿Alguien podría arrojar algo de luz?


Hay dos áreas de investigación que vienen a la mente.

El primero es el Aprendizaje de refuerzo . Este es un paradigma de aprendizaje en línea que le permite obtener retroalimentación y actualizar su política (en este caso, su clasificador) a medida que observa los resultados.

El segundo es el aprendizaje activo , donde el clasificador puede seleccionar ejemplos de un conjunto de ejemplos no clasificados para etiquetarse. La clave es hacer que el clasificador elija los ejemplos de etiquetado que mejor mejoren su precisión eligiendo ejemplos difíciles bajo la hipótesis del clasificador actual.