tutorial stable sklearn scikit org machine learning learn fit machine-learning statistics scikit-learn

machine-learning - stable - scikit learn vs tensorflow



Diferencia entre el escalador de normas y el normalizador en sklearn.preprocessing (5)

De los documentos del Normalizer :

Cada muestra (es decir, cada fila de la matriz de datos) con al menos un componente distinto de cero se vuelve a escalar independientemente de otras muestras, de modo que su norma (l1 o l2) sea igual a una.

Y StandardScaler

Estandarizar las características mediante la eliminación de la media y la escala a la variación de la unidad

En otras palabras, Normalizer actúa en filas y StandardScaler en columnas . El normalizador no elimina la media y la escala por desviación, sino que escala la fila entera a la norma de la unidad.

¿Cuál es la diferencia entre el escalador de normas y el normalizador en el módulo sklearn.preprocessing? ¿No hacen ambos lo mismo? ¿Es decir, eliminar la media y la escala utilizando la desviación?


Esta visualization y el article de Ben ayudan mucho a ilustrar la idea.

El StandardScaler asume que sus datos se distribuyen normalmente dentro de cada función. Al "eliminar la media y escalar a la variación de la unidad", puede ver en la imagen que ahora tienen la misma "escala" independientemente de la original.


StandardScaler () estandariza las características (como las características de los datos personales, es decir, la altura y el peso) al eliminar la media y la escala a la variación de la unidad.

(Variación de la unidad: La variación de la unidad significa que la desviación estándar de una muestra, así como la variación, tenderán hacia 1 a medida que el tamaño de la muestra tiende hacia el infinito).

Normalizador () vuelve a escalar cada muestra. Por ejemplo, volver a escalar el precio de las acciones de cada compañía independientemente del otro.

Algunas acciones son más caras que otras. Para dar cuenta de esto, lo normalizamos. El Normalizador transformará por separado el precio de las acciones de cada compañía a una escala relativa.


StandardScaler estandariza las características al eliminar la media y la escala a la varianza de la unidad, el Normalizador vuelve a escalar cada muestra.


escalador estándar Me refiero a que StandardScaler se usa para normalizar los datos para que se comporten como datos distribuidos normales. Se usa ampliamente en el aprendizaje automático porque supongamos que si consideras la altura como la característica que se comporta aleatoriamente al convertirla de cm a pies en comparación con peso, de modo que la normalización de los datos llega a nuestro rescate en este caso. Donde la normalización se realiza en filas.