google - Diferencia entre parámetros, características y clase en Machine Learning

machine learning google course free (3)

Soy un novato en el aprendizaje automático y el procesamiento del lenguaje natural.

Siempre estoy confundido entre cuáles son esos tres términos?

Desde mi entendimiento:

clase: las diversas categorías de nuestro modelo de salida. ¿Se le da un nombre de persona para identificar si él o ella es hombre o mujer?

Digamos que estoy usando el clasificador Naive Bayes.

¿Cuáles serían mis características y parámetros?

Además, ¿cuáles son algunos de los alias de las palabras anteriores que se usan indistintamente?

Gracias

@txizzle explicó bien el caso de Naive Bayes. En un sentido más general:

Clase: la categoría de salida de sus datos. Puedes llamar a estas categorías también. Las etiquetas en sus datos apuntarán a una de las clases (si es un problema de clasificación, por supuesto).

Características: las características que definen su problema. Estos también se llaman atributos.

Parámetros: las variables que su algoritmo intenta sintonizar para construir un modelo preciso.

A modo de ejemplo, supongamos que está tratando de decidir si admitir o no a un alumno en la escuela o en varios factores, como su GPA de pregrado, puntajes de exámenes, puntajes en recomendaciones, proyectos, etc. En este caso, los factores mencionados arriba están sus características / atributos, ya sea que el estudiante tenga permiso o no para convertirse en sus 2 clases, y los números que deciden cómo se combinan estas características para que su producción se convierta en sus parámetros. Lo que representan los parámetros realmente depende de tu algoritmo. Para una red neuronal, son los pesos en los enlaces sinápticos. De manera similar, para un problema de regresión, los parámetros son los coeficientes de sus características cuando se combinan.

tomar un problema de clasificación lineal simple-

y = {0 si 5x-3> = 0 else 1}

aquí y es clase, x es función, 5,3 son parámetros.

Usemos el ejemplo de clasificar el género de una persona. ¡Tu comprensión sobre la clase es correcta! Dada una observación de entrada, nuestro clasificador Naive Bayes debería generar una categoría. La clase es esa categoría.

Características : Las características en un clasificador Naive Bayes, o cualquier Algoritmo de clasificación ML general, son los puntos de datos que elegimos para definir nuestra entrada. Para el ejemplo de una persona, no podemos ingresar todos los puntos de datos sobre una persona; en su lugar, seleccionamos algunas características para definir a una persona (digamos "Altura", "Peso" y "Tamaño del pie"). Específicamente, en un clasificador Naive Bayes , la suposición clave que hacemos es que estas características son independientes (no se afectan entre sí): la altura de una persona no afecta el peso no afecta el tamaño del pie. Esta suposición puede ser o no cierta, pero para un Naive Bayes, suponemos que es cierto. En el caso particular de su ejemplo, donde la entrada es solo el nombre, las características pueden ser la frecuencia de las letras, el número de vocales, la longitud del nombre o el sufijo / prefijos.

Parámetros : los parámetros en Naive Bayes son las estimaciones de la verdadera distribución de lo que estamos tratando de clasificar. Por ejemplo, podríamos decir que aproximadamente el 50% de las personas son hombres, y la distribución de la altura masculina es una distribución gaussiana con una media de 5 ''7 "y una desviación estándar de 3". Los parámetros serían la estimación del 50%, la estimación media de 5 ''7 "y la estimación de la desviación estándar de 3".

Alias : las características también se conocen como atributos. No estoy al tanto de ningún reemplazo común para ''parámetros''.

¡Espero que haya sido útil!