machine learning - significado - ¿Dónde es mejor usar svm con kernel lineal?

support vector regression (5)

El kernel lineal tiene algunas ventajas, pero probablemente (en mi opinión) la más importante es el hecho de que, en general, es mucho más rápido entrenar en comparación con los kernels no lineales, como el RBF.

Si el tamaño de su conjunto de datos es en términos de gigabytes, vería que la diferencia de tiempo de entrenamiento es enorme (minutos vs. horas).

Actualmente estoy estudiando svm y me preguntaba cuál es la aplicación de svm`s con kernel lineal. En mi opinión, debe ser algo aplicado para resolver un problema de optimización lineal. ¿Es esto correcto?

¡Aprecio tu respuesta!

La aplicación de una máquina de vectores de soporte con un kernel lineal es realizar una clasificación o regresión. Se desempeñará mejor cuando haya un límite de decisión lineal o un ajuste lineal a los datos, por lo tanto el núcleo lineal.

Los núcleos lineales son los mejores para aplicar en datos linealmente separables. Imagina que tu conjunto de datos tiene solo 2 funciones y 2 clases. Si traza sus muestras de conjuntos de datos en un gráfico utilizando las 2 características como X e Y, podrá ver cómo las muestras de diferentes clases se ubican entre sí.

Si es fácil dibujar una línea que separa las dos clases, entonces un kernel lineal es ideal para el trabajo:

Por supuesto, esto funciona con muchas características, no solo dos, que representan espacios multidimensionales. Sin embargo, si sus datos no son linealmente separables, deberá mapear sus muestras en otro espacio dimensional, utilizando núcleos como RBF o polinomio.

Además, como el kernel lineal no realiza ningún mapeo, generalmente es más rápido entrenar su clasificador que con otros kernels.

SVM con kernel lineal es de hecho uno de los clasificadores más simples, pero no será sorprendente si obtenemos una precisión de rendimiento muy alta cuando la distribución de datos es linealmente separable.

En este sentido, creo que tu opinión es correcta. Sin embargo, debe darse cuenta de que el poder de SVM se encuentra en la extensión con núcleos no lineales mucho más complejos (por ejemplo, RBF).

Un enlace en la elección de clasificadores .

Una cosa más que agregar: el SVM lineal es menos propenso a sobrealimentar que no lineal. Y debe decidir qué kernel elegir en función de su situación: si su número de funciones es realmente grande en comparación con la muestra de entrenamiento, solo use el kernel lineal; Si su número de funciones es pequeño, pero la muestra de capacitación es grande, es posible que también necesite un núcleo lineal, pero intente agregar más funciones; si su número de función es pequeño (10 ^ 0 - 10 ^ 3), y el número de muestra es intermedio (10 ^ 1 - 10 ^ 4), usar kernel gaussiano será mejor.

Por lo que sé, la SVM con kernel lineal suele ser comparable con la regresión logística.