Weka - Cargando datos
En este capítulo, comenzamos con la primera pestaña que usa para preprocesar los datos. Esto es común a todos los algoritmos que aplicaría a sus datos para construir el modelo y es un paso común para todas las operaciones posteriores en WEKA.
Para que un algoritmo de aprendizaje automático brinde una precisión aceptable, es importante que primero debes limpiar tus datos. Esto se debe a que los datos sin procesar recopilados del campo pueden contener valores nulos, columnas irrelevantes, etc.
En este capítulo, aprenderá a preprocesar los datos sin procesar y a crear un conjunto de datos limpio y significativo para su uso posterior.
Primero, aprenderá a cargar el archivo de datos en el explorador WEKA. Los datos se pueden cargar desde las siguientes fuentes:
- Sistema de archivos local
- Web
- Database
En este capítulo, veremos las tres opciones de carga de datos en detalle.
Carga de datos desde el sistema de archivos local
Justo debajo de las pestañas de aprendizaje automático que estudió en la lección anterior, encontrará los siguientes tres botones:
- Abrir documento ...
- Abrir URL ...
- Abrir DB ...
Clickea en el Open file... botón. Se abre una ventana del navegador de directorios como se muestra en la siguiente pantalla:
Ahora, navegue hasta la carpeta donde se almacenan sus archivos de datos. La instalación de WEKA ofrece muchas bases de datos de muestra para que experimente. Estos están disponibles en eldata carpeta de la instalación de WEKA.
Para fines de aprendizaje, seleccione cualquier archivo de datos de esta carpeta. El contenido del archivo se cargaría en el entorno WEKA. Muy pronto aprenderemos a inspeccionar y procesar estos datos cargados. Antes de eso, veamos cómo cargar el archivo de datos desde la Web.
Cargando datos desde la web
Una vez que haga clic en el Open URL ... botón, puede ver una ventana de la siguiente manera:
Abriremos el archivo desde una URL pública Escriba la siguiente URL en el cuadro emergente -
https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff
Puede especificar cualquier otra URL donde se almacenan sus datos. losExplorer cargará los datos del sitio remoto en su entorno.
Cargando datos desde la base de datos
Una vez que haga clic en el Open DB ... botón, puede ver una ventana de la siguiente manera:
Configure la cadena de conexión a su base de datos, configure la consulta para la selección de datos, procese la consulta y cargue los registros seleccionados en WEKA.