machine library learning español ejemplo curso python machine-learning scikit-learn feature-selection one-hot-encoding

español - machine learning python library



¿Cómo recuperar los nombres de los coeficientes después de la codificación de la etiqueta y una codificación en caliente en scikit-learn? (0)

Estoy ejecutando un modelo de aprendizaje automático (Ridge Regression w / Cross-Validation) utilizando el método RidgeCV () de scikit-learn. Mi conjunto de datos tiene 5 características categóricas y 2 numéricas, así que comencé con LabelEncoder () para convertir las características categóricas en enteros, y luego apliqué OneHotEncoder () para crear varias columnas de características nuevas de 0 y 1 para aplicar mi Modelo de aprendizaje automático.

Mi X_train ahora es una matriz numpy, y después de ajustar el modelo, estoy obteniendo sus coeficientes, por lo que me pregunto: ¿hay alguna manera directa de volver a conectar estos coeficientes a las características individuales a las que corresponden? A diferencia de los get_dummies de Pandas, OneHotEncoder no parece generar ningún título para las características individuales que genera fuera de los categorizados etiquetados ...

PD: He usado el atributo .classes_ de LabelEncoder y .feature_indices_ de OneHotEncoder, pero ninguno de ellos me da exactamente lo que estoy buscando. He preguntado en Cross Validated pero me recomendaron Stack Overflow.