Scikit Learn - Complemento Naïve Bayes
Otro modelo Bayes ingenuo útil que fue diseñado para corregir las severas suposiciones hechas por el clasificador Multinomial Bayes. Este tipo de clasificador NB es adecuado para conjuntos de datos desequilibrados. El Scikit-learn proporcionasklearn.naive_bayes.ComplementNB implementar el algoritmo Gaussiano Naïve Bayes para la clasificación.
Parámetros
La siguiente tabla consta de los parámetros utilizados por sklearn.naive_bayes.ComplementNB método -
No Señor | Descripción de parámetros |
---|---|
1 | alpha - flotante, opcional, predeterminado = 1.0 Representa el parámetro de suavizado aditivo. Si elige 0 como valor, no habrá suavizado. |
2 | fit_prior - Booleano, opcional, predeterminado = verdadero Le dice al modelo si debe aprender las probabilidades previas de la clase o no. El valor predeterminado es Verdadero, pero si se establece en Falso, los algoritmos utilizarán un anterior uniforme. Este parámetro solo se usa en caso de borde con una sola clase en el conjunto de datos de entrenamiento. |
3 | class_prior - tamaño (n_classes,), opcional, Predeterminado = Ninguno Este parámetro representa las probabilidades previas de cada clase. |
4 | norm - Booleano, opcional, predeterminado = Falso Le dice al modelo si debe realizar una segunda normalización de los pesos o no. |
Atributos
La siguiente tabla consta de los atributos utilizados por sklearn.naive_bayes.ComplementNB método -
No Señor | Atributos y descripción |
---|---|
1 | class_log_prior_ - matriz, forma (n_classes,) Proporciona la probabilidad logarítmica empírica suavizada para cada clase. Este atributo solo se usa en caso de borde con una sola clase en el conjunto de datos de entrenamiento. |
2 | class_count_ - matriz, forma (n_classes,) Proporciona el número real de muestras de formación encontradas para cada clase. |
3 | feature_log_prob_ - matriz, forma (n_classes, n_features) Da los pesos empíricos para los componentes de la clase. |
4 | feature_count_ - matriz, forma (n_classes, n_features) Proporciona la cantidad real de muestras de entrenamiento encontradas para cada (clase, característica). |
5 | feature_all_ - matriz, forma (n_features,) Proporciona la cantidad real de muestras de entrenamiento encontradas para cada función. |
Los métodos de sklearn.naive_bayes.ComplementNB son los mismos que hemos usado en sklearn.naive_bayes.GaussianNB..
Ejemplo de implementación
La secuencia de comandos de Python a continuación utilizará sklearn.naive_bayes.BernoulliNB método para construir el clasificador Bernoulli Naïve Bayes a partir de nuestro conjunto de datos -
Ejemplo
import numpy as np
X = np.random.randint(15, size = (15, 1000))
y = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])
from sklearn.naive_bayes import ComplementNB
CNBclf = ComplementNB()
CNBclf.fit(X, y)
Salida
ComplementNB(alpha = 1.0, class_prior = None, fit_prior = True, norm = False)
Ahora, una vez ajustado, podemos predecir el nuevo valor aby usando el método predict () de la siguiente manera:
Ejemplo
print((CNBclf.predict(X[10:15]))
Salida
[11 12 13 14 15]