algorithm - pagina - weka tutorial pdf

¿Qué es "ingenuo" en un clasificador de Bayes ingenuo? (4)

Hay realmente un muy buen ejemplo en Wikipedia :

En términos simples, un clasificador de Bayes ingenuo asume que la presencia (o ausencia) de una característica particular de una clase no está relacionada con la presencia (o ausencia) de cualquier otra característica, dada la variable de clase. Por ejemplo, una fruta puede ser considerada como una manzana si es roja, redonda y de aproximadamente 4 "de diámetro. Incluso si estas características dependen una de la otra o de la existencia de las otras características, un ingenuo clasificador de Bayes considera todas estas características. Estas propiedades contribuyen de manera independiente a la probabilidad de que esta fruta sea una manzana.

Básicamente, es "ingenuo" porque hace suposiciones que pueden o no resultar correctas.

¿Qué tiene de ingenuo el ingenuo Bayes?

Para la clasificación cuando encontramos la distribución conjunta, el problema es que simplemente refleja los datos de entrenamiento y también es muy difícil de calcular. Así que necesitamos algo que generalice más útilmente.

El modelo ingenuo generaliza fuertemente que cada atributo se distribuye independientemente de cualquier otro atributo.

Realmente ayuda a no preocuparse por la dependencia entre los atributos en gran medida.

Se llama ingenuo porque supone que todos los atributos son independientes entre sí. Esta suposición es la razón por la que se llama ingenuo, ya que en muchas situaciones del mundo real esto no encaja. A pesar de esto, el clasificador funciona extremadamente bien en muchas situaciones del mundo real y tiene un rendimiento comparable al de redes neutrales y SVM en ciertos casos (aunque no en todos).

Si sus datos se componen de un vector de características X = {x1, x2, ... x10} y sus etiquetas de clase Y = {y1, y2, .. y5}. Por lo tanto, un clasificador de Bayes identifica la etiqueta de clase correcta como la que maximiza la siguiente fórmula:

P (y / X) = P (X / y) * P (y) = P (x1, x2, ... x10 / y) * P (y)

Así que para, todavía no es ingenuo. Sin embargo, es difícil calcular P (x1, x2, ... x10 / Y), por lo que asumimos que las características son independientes, esto es lo que llamamos el supuesto ingenuo, por lo tanto, terminamos con la siguiente fórmula

P (y / X) = P (x1 / y) * P (x2 / y) * ... P (x10 / y) * P (y)