Tutorial de Weka: aprendizaje automático basado en GUI con Java

Hoy en día, los lenguajes de programación como Python y R son, sin duda, algunos de los lenguajes más demandados en Data Science y Machine Learning.

Pero, ¿es también posible realizar tareas comunes de aprendizaje automático y ciencia de datos sin necesariamente ser competente en codificación?

¡Por supuesto que es! Weka es un paquete de código abierto basado en la interfaz gráfica de usuario. Se puede usar para realizar tareas comunes de ciencia de datos simplemente usando la interfaz gráfica.

Lo esencial

Weka se puede instalar fácilmente en cualquier tipo de plataforma siguiendo las instrucciones del siguiente enlace. El único requisito previo es tener Java 8.0 instalado en su máquina local.

Una vez que haya instalado Weka, tendrá un conjunto de técnicas estándar de procesamiento e inferencia de datos como:

  • Preprocesamiento de datos : una vez que haya cargado un conjunto de datos, Weka le permite explorar rápidamente sus atributos e instancias. Además, hay diferentes técnicas de filtrado disponibles para, por ejemplo, convertir datos categóricos en numéricos o realizar la selección de características para reducir la dimensionalidad de nuestro conjunto de datos (por ejemplo, para acelerar los tiempos de entrenamiento y el rendimiento).
  • Algoritmos de clasificación y regresión:una colección de diferentes algoritmos como Gaussian Naive Bayes, Decision Trees, K-Nehest Neighbor, técnicas de Ensembles y varias variantes de regresión lineal.
  • Clustering: esta técnica se puede utilizar para identificar las principales categorías en nuestros datos de forma no supervisada. Algunos ejemplos de algoritmos disponibles en la colección de Weka son Agrupación de K-medias y Maximización de expectativas.
  • Descubrir asociaciones: descubrir reglas en nuestro conjunto de datos para identificar más fácilmente patrones y conexiones entre las diferentes características.
  • Visualización de datos:un conjunto de técnicas de visualización de datos integradas para visualizar rápidamente correlaciones entre funciones y representar patrones de aprendizaje automático aprendidos, como árboles de decisión y agrupación de K-Means

Otra característica interesante de Weka es la capacidad de instalar nuevos paquetes a medida que se crean.

Un ejemplo de un paquete adicional que puede instalar es AutoML. De hecho, AutoML puede ser particularmente útil para los principiantes que pueden tener dificultades para identificar qué modelo de aprendizaje automático podría ser mejor para usar para una tarea específica.

Con el paquete Weka AutoML, puede probar fácilmente diferentes modelos de aprendizaje automático sobre la marcha. También le permite ajustar automáticamente sus hiperparámetros para aumentar el rendimiento.

Finalmente, para los usuarios más expertos, Weka también ofrece una interfaz de línea de comandos para usar código Java. Esto puede ser particularmente útil, especialmente si está trabajando con grandes cantidades de datos.

Ejemplo

Ahora vamos a recorrer un ejemplo sencillo para demostrar cómo empezar con Weka.

En primer lugar, podemos comenzar nuestro análisis abriendo Weka Explorer y abriendo nuestro conjunto de datos (en este ejemplo, el conjunto de datos Iris).

Seleccione la pestaña Clasificar, elija Naive Bayes como nuestro clasificador y haga clic en iniciar. Verá que podemos lograr rápidamente una precisión de clasificación del 96% sin tener que escribir ningún código.

Conclusión

En caso de que esté buscando más información sobre cómo comenzar con Weka, esta serie de YouTube de Google Developers es un excelente lugar para comenzar.

Contáctame

Si quieres mantenerte actualizado con mis últimos artículos y proyectos, sígueme en Medium y suscríbete a mi lista de correo. Estos son algunos de los datos de mis contactos:

  • Linkedin
  • Blog personal
  • Sitio web personal
  • Perfil medio
  • GitHub
  • Kaggle

Foto de portada de este artículo.