Necesita estas hojas de trucos si está abordando algoritmos de aprendizaje automático.

Cuando comencé a aprender Machine Learning (ML) hace dos años, tenía muchas preguntas sobre qué algoritmos usar, cómo correlacionarlo con conjuntos de datos, etc. La respuesta dependía de muchos factores como el tamaño de los datos, la producción esperada y la computación disponible. recursos. Luego me presentaron las hojas de trucos de ML que me familiarizaron con los algoritmos, paquetes y funciones de uso frecuente.

Esta publicación contiene las tres principales hojas de trucos que recomendaría a un principiante que esté interesado en identificar y aplicar algoritmos de aprendizaje automático a diferentes problemas. Dada la rapidez con la que evoluciona este dominio, los algoritmos de tendencias también están progresando. Por lo tanto, es importante comprender los algoritmos que ayudan a adaptarse a las áreas de aprendizaje supervisado y no supervisado, clasificación y regresión, etc.

Diagrama de flujo del algoritmo SAS

Fuente: //blogs.sas.com/content/subciousmusings/2017/04/12/machine-learning-algorithm-use/

El blog de SAS en sí es una gran lectura. El enlace muestra cómo usar la hoja de trucos, así como las consideraciones al elegir un algoritmo. La hoja de trucos muestra un diagrama de flujo fácil de usar que correlaciona los datos con los algoritmos.

Hojas de trucos de Python y Scikit

La mayoría de los desarrolladores trabajan en lenguaje Python o R para implementar los algoritmos ML. Trabajo en Python, por lo que las siguientes dos hojas de trucos me han resultado muy útiles.

Fuente: //s3.amazonaws.com/assets.datacamp.com/blog_assets/PythonForDataScience.pdf

La hoja de trucos de Python fue preparada por DataCamp y también se puede utilizar como una referencia rápida para guiar a través de los paquetes de ML Python y las estructuras de datos.

Fuente: //s3.amazonaws.com/assets.datacamp.com/blog_assets/Scikit_Learn_Cheat_Sheet_Python.pdf

Scikit-learn es una biblioteca de Python de código abierto que implementa una amplia variedad de aprendizaje automático, preprocesamiento de datos y validación cruzada, así como visualización de algoritmos. Esta biblioteca pertenece a la información que debe conocer todo aspirante a científico de datos, por lo que recomiendo esta hoja de trucos.

Mapa de aprendizaje automático fácil de usar

Fuente: //scikit-learn.org/stable/tutorial/machine_learning_map/

Esta hoja de trucos está disponible en los tutoriales de scikit-learn y es uno de los diagramas de flujo más fáciles de entender y usar. En el enlace anterior, tiene el flujo completo para resolver un problema de aprendizaje automático y también puede hacer clic en cualquier algoritmo del mapa para comprender su implementación.

¡Comparte y aprende! Agregue su hoja de trucos favorita en los comentarios a continuación.