Enséñese la ciencia de datos: el camino de aprendizaje que usé para conseguir un trabajo de análisis en Jet.com

¿Cómo se puede pasar de cero habilidades de programación a un trabajo en tecnología o analítica?

Si está interesado en aprender estas habilidades, ya sea por diversión o para un cambio de carrera, ¿cuál es la mejor manera de hacerlo?

Existen innumerables listas de los mejores cursos en línea, pero ¿cómo puedes forjar tu propio camino de aprendizaje con todo el ruido?

Personalmente, nunca pensé que aprendería habilidades prácticas en programación, análisis de datos, aprendizaje automático o tecnología en general. Como estudiante de finanzas, siempre asumí que sería el "hombre de negocios". Sin embargo, de alguna manera, aprendí Python y SQL por mi cuenta, y me encontré trabajando en análisis en Jet.com, usando uno de estos lenguajes todos los días.

¿Por qué Python y SQL, podría preguntar?

Python es el lenguaje de programación de más rápido crecimiento que existe, y por una buena razón. Tiene una cantidad increíble de bibliotecas que puede usar para aplicaciones de aprendizaje automático, análisis de datos, visualización, aplicaciones web, integraciones de API y mucho más. Además, es uno de los idiomas más fáciles de aprender y aprender. En cuanto a SQL, las bases de datos impulsan a las empresas de tecnología, y SQL le permite comprender, explorar y utilizar mejor los tesoros de los datos recopilados.

A continuación, describo el camino que tomé para aprender estos lenguajes que me llevaron a la analítica. Para ser claros, este camino fue increíblemente desafiante; Pasé innumerables noches sintiéndome frustrado y confundido. Muchas noches quería tirar la toalla y conformarme con ser el hombre de negocios.

Pero su motivación sigue siendo la clave para superar los obstáculos que inevitablemente enfrentará. Ya sea que desee pasar a un rol de análisis de datos o de ciencia de datos, o simplemente quiera tener una mejor comprensión de la programación y la tecnología por el gusto de hacerlo (¡lo cual se vuelve divertido!), Debe descubrir cómo mantenerse motivado y disciplinado si realmente quieres aprender estas habilidades.

Para mí, reservar cantidades específicas de tiempo casi todos los días (alrededor de 90 minutos a 2 horas) para aprender o practicar inmediatamente después de llegar a casa del trabajo me permitió desarrollar hábitos consistentes y martillar conceptos básicos que encontré confusos.

Este es el camino que tomé; con suerte, puede ayudarlo a comenzar por su cuenta.

La base fundamental

  1. Aprenda Python de la manera difícil

Este es uno de los mejores cursos que he tomado, punto. Es autodirigido y desafiante, pero Zed le brinda suficientes detalles y orientación para comenzar a comenzar a programar en Python. Él hace que la programación se sienta accesible, y el material te da la confianza semana tras semana para sentir que realmente puedes aprender Python de manera efectiva.

2. Análisis de modo: Pandas

Mode Analytics proporciona una excelente introducción a Python e incluye tutoriales sobre una de sus estructuras de datos más poderosas: Pandas DataFrame. Esto es perfecto para aprender los conceptos básicos del análisis de datos una vez que tenga los fundamentos de Python.

3. Análisis de modo: SQL

El otro tutorial de Mode Analytics sobre SQL también es fantástico. Puede aprender todos los conceptos clave y crear una base SQL sólida aquí. Incluso tienen su propio editor SQL y datos con los que puede jugar.

Junto con Mode Analytics, W3 Schools puede ayudar a responder cualquier pregunta de SQL que tenga a medida que avanza en los tutoriales.

Buceando en el aprendizaje automático

Antes de tener un conocimiento profundo de Python, tomé una foto y solicité el nano grado de auto sin conductor de Udacity. Sabía que estaba completamente sobre mi cabeza, pero pensé, ¿por qué no intentarlo?

Es más fácil motivarse para aprender Python y el aprendizaje automático cuando está fascinado con las aplicaciones prácticas.

Tenía alrededor de un mes antes de que comenzara la clase, así que tomé tantas clases sobre ciencia de datos y aprendizaje automático como fuera posible.

Estos fueron los mejores cursos introductorios gratuitos que encontré que fueron increíblemente útiles:

  • Introducción al aprendizaje automático de Udacity
  • Introducción a las estadísticas de Udacity
  • Introducción de Udacity a la ciencia de datos

Sí, puedes ver que pienso muy bien en Udacity.

Si bien no es gratis, también recomiendo encarecidamente consultar el libro Grokking Deep Learning. Proporciona ejemplos extremadamente claros y fáciles de identificar sobre los fundamentos del aprendizaje automático.

TensorFlow, desarrollado por Google, es una biblioteca de código abierto para el aprendizaje automático que se puede escribir en Python. Es increíblemente poderoso y vale la pena familiarizarse con él.

Consulte el ejercicio MNIST para obtener una fantástica introducción al marco.

Encontré que la clase Stanford CS231 también es un recurso útil; cubre ampliamente las redes neuronales convolucionales (lo que usamos para el software de reconocimiento facial o de imagen), lo que leí sería increíblemente útil para el automóvil autónomo Nanodegree. Si está interesado en usar el aprendizaje automático con imágenes o videos, no encontrará nada mejor que este curso.

Finalmente, después de usar estos recursos para construir una base sólida, comencé el Nanodegree de Udacity Self Driving Car.

No voy a hablar mucho de eso, ya que hay excelentes reseñas del curso aquí y aquí. Lo que diré es que, para mi propia sorpresa, a pesar de ser el curso más desafiante que he tomado, pude entender la mayor parte del contenido. Con el conocimiento básico adecuado, se sorprenderá de lo profundo que puede ser su comprensión de un tema complejo.

Aprendizaje continuo de análisis y ciencia de datos

Después de sumergirme intensamente en el aprendizaje automático durante unos meses, fue útil dar un paso atrás y reforzar mi comprensión de los principios prácticos de análisis y ciencia de datos.

Empecé con Data Science, Deep Learning y Machine Learning con Python, un curso fantástico sobre Udemy . Si bien aborda el aprendizaje automático, cubre completamente los principios de análisis, ciencia de datos y estadísticas, particularmente en torno a diferentes técnicas de minería de datos y escenarios prácticos para implementarlos.

El libro Data Science For Business , también explica increíblemente bien el CÓMO y POR QUÉ funcionan ciertos modelos al resolver problemas en un contexto específico; le da un marco analítico y una mentalidad que se puede aplicar a cualquier situación relacionada con problemas de datos. Es el mejor recurso que encontré que conecta diferentes enfoques analíticos a situaciones y problemas comerciales específicos.

Por supuesto, si está interesado en seguir una carrera en análisis o ciencia de datos, siempre debe perfeccionar sus viejas habilidades o agregar nuevas habilidades a su conjunto de herramientas. FreeCodeCamp y Hackernoonpublique artículos informativos y tutoriales sobre todo lo relacionado con la ciencia de datos y la ingeniería de software. Mi artículo favorito recientemente fue un tutorial bien escrito sobre cómo escribir su propia cadena de bloques.

¿Quieres saber cuál es la mejor forma de seguir aprendiendo?

Construye algo. Cualquier cosa. Explore un conjunto de datos. Encuentre un problema práctico al que usted o su empresa se enfrenten e intente resolverlo.

Incluso si no tiene acceso a datos de alta calidad en su empresa, hay muchos conjuntos de datos de código abierto con los que puede jugar y practicar. Apuesto a que aprenderá tanto, si no más, trabajando en sus propios proyectos de datos que tomando cualquier curso o leyendo cualquier libro.

Finalmente, conocer y aprender de personas que tienen las habilidades que desea adquirir es muy beneficioso. Recomiendo encarecidamente usar Meetup para encontrar grupos de analistas o profesionales de software en su área. Muchos de estos grupos tienen tutoriales o sesiones de estudio gratuitos, y conocerás a muchas personas increíblemente inteligentes que pueden brindarte consejos y trucos para acelerar tu aprendizaje.

En la ciudad de Nueva York, algunos de los grupos que me han ayudado enormemente son:

  • Sociedad de aprendizaje automático
  • Grupo de desarrolladores de Google
  • NYAI
  • Ciencia de datos de Nueva York

¡Diviértete aprendiendo y cuéntame cómo va tu propio viaje!

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

ACTUALIZACIÓN : Udacity acaba de lanzar un nuevo programa Data Scientist Nanodegree. ¡He revisado los materiales y parece un recurso increíblemente útil! Los proyectos incluyen la construcción de un motor de recomendaciones con datos de IBM y la clasificación de los clientes en segmentos. Aún no lo he tomado, pero compruébalo aquí: programa Data Scientist Nanodegree.