Revisión: Programa Nanodegree de Udacity Data Analyst

El programa Data Analyst Nanodegree de Udacity fue uno de los primeros programas de ciencia de datos en línea en la revolución de la educación en línea. Su objetivo es "garantizar que domine las habilidades exactas necesarias para desarrollar una carrera en ciencia de datos". ¿Cumple su objetivo? ¿Es la mejor opción disponible?

Completé el programa en otoño de 2016. Inspirándome en la plantilla de revisión de código abierto de Class Central, aquí está mi revisión para el programa Data Analyst Nanodegree de Udacity.

ACTUALIZACIÓN: El programa Data Analyst Nanodegree se actualizó con nuevo contenido y servicios para estudiantes en septiembre de 2017. Detalles aquí. También me incorporaron para ayudar a recrear parte de este nuevo contenido. La mayor parte de esta revisión no se modifica. Las actualizaciones de hechos se indican en cursiva.

Información de contexto

¿Qué me hizo decidir tomar este programa?

A principios de 2016, comencé a crear mi propio programa de maestría en ciencia de datos utilizando recursos en línea. (Puede leer sobre eso aquí). Me inscribí en el programa Data Analyst Nanodegree por algunas razones:

  • Quería una guía para mi introducción a la ciencia de datos.
  • Quería un programa coherente en lugar de cursos individuales de una variedad de proveedores.
  • Recibió críticas estelares.
  • Había tomado algunos cursos de Udacity antes y era fanático de su estilo de enseñanza.

Cuales eran mis metas?

Aunque el programa puede actuar como un puente hacia un trabajo (más sobre esto más adelante), quería usar el programa como una introducción a material más avanzado. Este “material más avanzado” se aplica tanto a las materias que se tratan en el programa como a las que no.

¿Qué es un programa de Udacity Nanodegree?

Udacity es uno de los principales proveedores de educación en línea. Sebastian Thrun, ex profesor de Stanford y fundador de Google X, fundó la empresa y se centra en la innovación en Udacity como presidente y director. Vish Makhijani es el director ejecutivo.

Los programas Nanodegree son credenciales en línea proporcionadas por Udacity. Son compilaciones de cursos de Udacity (algunos disponibles de forma gratuita, otros no) que tienen proyectos adjuntos, que son revisados ​​por los revisores de proyectos pagados de Udacity. También vienen con un montón de servicios para estudiantes.

Slack se utiliza como una herramienta comunitaria, donde los estudiantes de Udacity pueden interactuar con otros estudiantes, así como con los instructores de su programa y otro personal de Udacity. En la mayoría de los programas, los estudiantes tienen mentores asignados y se comunican con ellos a través de un canal de chat privado que siempre está disponible en el aula de Udacity.

El programa Data Analyst Nanodegree se lanzó originalmente en 2014. Fue el segundo programa Nanodegree de Udacity. Aunque ha sufrido algunos cambios a lo largo de los años, el núcleo del programa está intacto.

¿Quiénes son los instructores y cuáles son sus antecedentes?

Debido a que el programa Data Analyst Nanodegree es una compilación de los cursos de Udacity (nuevamente, algunos son gratuitos, otros no), hay varios instructores. Sus currículums suelen incluir puestos prestigiosos en las principales empresas de tecnología y títulos de las mejores escuelas de EE. UU.

No son “instructores” per se, pero los revisores del proyecto, los mentores y el personal de experiencia de los estudiantes de Udacity (que supervisan Slack junto con los instructores) se encuentran entre las personas con las que más interactúas. Son tan, tan útiles. Más sobre eso más tarde.

Costo

El programa se divide en dos términos. El primer trimestre cuesta $ 499 USD. El segundo trimestre cuesta $ 699 USD. Si tiene una sólida comprensión de las habilidades que se enseñaron en el primer período, puede omitirlo, completar el segundo período únicamente y aún obtener la credencial.

Requisitos previos recomendados

Para el primer trimestre, Udacity recomienda que los estudiantes estén familiarizados con las estadísticas descriptivas y tengan algo de experiencia trabajando con datos en hojas de cálculo o SQL.

Para el segundo trimestre, los estudiantes deben tener experiencia en el análisis de datos utilizando Python, así como una sólida comprensión de la estadística inferencial y sus aplicaciones.

Mis antecedentes / habilidades al ingresar al programa

Comencé el programa en mayo de 2016 cuando tenía algunos meses de experiencia en programación, principalmente en C y Python. La gran mayoría de esta experiencia fue del módulo puente para mi programa de maestría en ciencia de datos, donde tomé el programa CS50: Introducción a las ciencias de la computación de Harvard y el programa Intro to Programming Nanodegree de Udacity.

También había terminado mi programa de licenciatura en ingeniería química y tenía 24 meses de experiencia laboral relacionada con la cuantificación. Esto significaba que había tomado varios cursos de estadística y me sentía cómodo con los datos.

El programa

Estructura

El programa Data Analyst Nanodegree se divide en dos términos. Cada término tiene tres cursos y cuatro proyectos (el proyecto adicional es un proyecto de introducción que lo ayuda a acostumbrarse al entorno de aprendizaje de Udacity). Mat Leonard, el líder del plan de estudios del programa en el momento de la actualización, está presente durante todo el programa mientras presenta cada curso, su propósito en el programa y sus instructores.

El contenido del curso se compone de una combinación de videos, texto y cuestionarios. Los videos tienden a oscilar entre 30 segundos y cinco minutos, según el estilo de Udacity. Los cuestionarios calificados automáticamente a menudo siguen estos videos cortos. Estos cuestionarios suelen ser tareas de programación de selección múltiple, de relleno en blanco o pequeñas. Después de adquirir CloudLabs, estas tareas de programación ahora se llevan a cabo en entornos de codificación Jupyter Notebook y SQL en el aula de Udacity.

Nuevamente, cada sección tiene un proyecto calificado. Estos proyectos y los comentarios de los revisores de proyectos pagados de Udacity son donde radica gran parte del valor para los estudiantes.

Silaba

Mi edición del programa tenía siete partes:

  • P1: Estadística descriptiva e inferencial
  • P2: Introducción al análisis de datos (con NumPy y pandas)
  • P3: Gestión de datos con MongoDB (o SQL)
  • P4: Análisis de datos exploratorios (con R)
  • P5: Introducción al aprendizaje automático
  • P6: Visualización de datos con D3.js
  • P7: Diseñar una prueba A / B

El primer término del nuevo programa se llama Análisis de datos con Python y SQL . Los cursos y proyectos incluyen:

  • Proyecto de introducción: Explore las tendencias meteorológicas. SQL y hojas de cálculo (o Python / R si ya está familiarizado) se utilizan para analizar y visualizar datos de temperatura.
  • Curso: Introducción a Python. Proyecto: Explore los datos de bicicletas compartidas de EE. UU.
  • Curso: Introducción al análisis de datos, que incluye el proceso de análisis de datos y SQL para análisis de datos. Proyecto: Investigar un conjunto de datos.
  • Curso: Estadística práctica. Proyecto: Analizar resultados de pruebas A / B.

El segundo término se llama Análisis de datos avanzado . Los cursos y proyectos incluyen:

  • Proyecto de introducción: Prueba un fenómeno perceptual. Calcule estadísticas descriptivas y realice una prueba estadística en un conjunto de datos basado en un fenómeno psicológico llamado Efecto Stroop.
  • Curso: Gestión de datos (con Python). Proyecto: Discutir y analizar datos. Este es el curso y proyecto que creé. ?
  • Curso: Análisis Exploratorio de Datos (con R). Proyecto: explorar y resumir datos.
  • Curso: narración de datos (con Tableau). Proyecto: cree una historia de Tableau.

Los grandes cambios, con todos los detalles descritos en esta publicación de blog:

  • Python ahora se enseña en el programa.
  • El aprendizaje automático y las pruebas A / B ahora se incluyen como material opcional y ya no son requisitos para graduarse del programa. Razonamiento: “El enfoque de este programa es prepararlo para trabajos de analista de datos. Nuestra investigación muestra que el aprendizaje automático no es un requisito para la gran mayoría de los puestos de analistas de datos ". Los conceptos básicos de las pruebas A / B ahora se cubren en el nuevo curso de estadísticas prácticas, lo que brinda a los estudiantes la exposición que necesitarán en el trabajo.
  • Nuevos cursos y proyectos. Específicamente, Introducción al análisis de datos (que incluye Python para análisis de datos y SQL para análisis de datos), Estadísticas prácticas (impartidas por Sebastian Thrun) y Reproducción de datos.

Calificación

Los proyectos se califican sobre la base de aprobado / reprobado (oficialmente, "cumple con las especificaciones" y "requiere cambios") de acuerdo con una rúbrica única. Su proyecto debe satisfacer todas las secciones de la rúbrica. Si todos sus proyectos cumplen con las especificaciones, se gradúa. Esto significa que los cuestionarios calificados automáticamente no cuentan para su calificación.

Si la presentación de un proyecto requiere cambios, el revisor de su proyecto le brindará comentarios prácticos. Después de implementar estos cambios, puede volver a enviarlos. No hay límite de envío.

Mi experiencia

Cronología

El cronograma estimado de Udacity para el programa Data Analyst Nanodegree era de 378 horas cuando comencé, lo que significaba que los estudiantes tardaban entre 6 y 7 meses en completarlo. Según Toggl (una aplicación de seguimiento del tiempo), todo el programa me llevó 369 horas durante cinco meses. Esta línea de tiempo incluyó dedicar mucho tiempo a hacer que mi cartera de proyectos tuviera calidad, en lugar de producir el mínimo para satisfacer la rúbrica de aprobado / reprobado.

El programa se condensó en la actualización de otoño de 2017. El nuevo cronograma estimado es de 260 horas . Cada período tiene un ritmo de 10 horas por semana durante 13 semanas, aunque los estudiantes tienen 19 semanas para completar cada período.

¿Cómo estuvo el contenido del curso?

Para mi edición del programa, el contenido del curso de P1 (Estadísticas), P2 (Introducción al análisis de datos), P4 (Análisis de datos exploratorios), P5 (Aprendizaje automático) y P7 (Pruebas A / B) obtienen cinco estrellas de cinco de mi parte. P3 (Data Wrangling) y P6 obtienen tres estrellas y media.

El contenido del análisis de datos exploratorios con los empleados de Facebook (P4) fue muy esclarecedor. La introducción al curso de aprendizaje automático con Sebastian Thrun y Katie Malone (P5) fue lo más divertido que he tenido en cualquier curso en línea. El contenido de las pruebas A / B con los empleados de Google (P7) es tan único. Le daría seis estrellas a esos tres campos si pudiera.

El contenido de SQL y Data Wrangling (P3) no fue sorprendente. Lo mismo ocurre con el contenido de visualización de datos (P6), aunque probablemente se deba a que D3.js es muy difícil de enseñar a los principiantes de JavaScript. Estas opiniones no son infrecuentes, según las revisiones de Class Central para esos cursos. Míralos aquí y aquí.

Este contenido "no sorprendente" del programa anterior se eliminó en la actualización de otoño de 2017. Ahora se incluye contenido renovado para la introducción al análisis de datos, SQL, estadísticas, negociación de datos y visualización de datos. El contenido de Estadística práctica se centra en la estadística inferencial, siendo la estadística descriptiva un requisito previo y se enseña en el programa Data Foundations Nanodegree. El curso de visualización de datos ahora se imparte con Tableau en lugar de D3.js.

¿Cómo fueron los proyectos?

Una vez más, los proyectos son donde Udacity se distingue del resto de plataformas de educación en línea. Invierten en el proceso de revisión de su proyecto y vale la pena. El programa Data Analyst Nanodegree no fue una excepción.

Todos los proyectos refuerzan el contenido que aprendiste en los videos. Los revisores del proyecto saben lo que hacen. Le dicen dónde tuvo éxito y dónde están sus errores y / u omisiones. Aprendizaje supervisado haciendo. Funciona.

Los foros y los mentores del foro son especialmente útiles cuando te atascas. Busque en los foros para ver si su problema es común (normalmente lo son). ¿Sin suerte? Publique una nueva pregunta usted mismo. Hay un mentor del foro, Myles Callan, que parece saberlo todo sobre todo y responde en cuestión de horas. Tengo mis dudas de que duerma.

Aunque los foros todavía existen y funcionan, Slack y los mentores en el aula son ahora las vías de soporte recomendadas. Los estudiantes pueden publicar preguntas y las respuestas se proporcionan con el mismo o mayor nivel de inmediatez (en horas y, a menudo, antes). La comunidad de Slack está supervisada por instructores de Udacity, así como por su personal de experiencia estudiantil, que se asegura de que las preguntas, comentarios, etc. de los estudiantes se aborden de manera oportuna. El famoso Myles Callan es ahora un mentor.

Si tiene curiosidad por ver cómo se ven estos proyectos, consulte este repositorio de Github.

¿Qué tan difícil fue?

El contenido de estadísticas fue fácil para mí porque había tomado varios cursos de estadísticas en la licenciatura. Esto probablemente sería cierto para todos los temas del programa Nanodegree si tuvieras experiencia previa en él.

Clasificaría la mayor parte del programa como dificultad intermedia. El contenido de las conferencias que no tiene muchos cuestionarios (aunque a menudo los tiene) puede ser muy sencillo, lo cual no es necesariamente algo malo. Los proyectos ejercitan tu cerebro. Cada uno probablemente le llevará más de veinte horas si quiere ser minucioso.

El proyecto de Análisis de datos exploratorios fue el más difícil de aprobar. Me tomó 3,5 presentaciones. Consulte este hilo de Twitter para obtener más detalles.

¿Puede solicitar puestos de trabajo inmediatamente después de la graduación?

Usted puede. El programa debe equiparlo con las habilidades necesarias para un rol de analista de datos de nivel de entrada si lo toma en serio. Eli Kastelein es un ejemplo perfecto de eso. Puede leer más sobre su historia a continuación.

Cómo construir una carrera en tecnología sin un título de CS

En la primavera de 2014, fui un recién llegado a la universidad en un autobús Greyhound que no se dirigía a ninguna parte en particular. medium.com

También puede continuar con cursos más avanzados, tanto para las materias cubiertas en el programa como para otras materias. Esto es lo que elegí hacer.

Pensamientos finales

¿Volvería a tomar el programa sabiendo lo que sé ahora?

En algún momento hacia el final del programa, comencé a crear la Guía de carrera de ciencia de datos de Class Central. Esto implicó investigar cada curso en línea ofrecido para cada tema dentro de la ciencia de datos.

Aunque disfruté de la mayoría de los cursos dentro del programa Nanodegree (actualización: los nuevos cursos han reemplazado los cursos que no disfruté) , hay cursos de otros proveedores que reciben mejores críticas para ciertos temas. Estadísticas, por ejemplo. Si tuviera acceso a mi guía cuando comencé, consideraría la ruta de cursos separados para cada materia. Sin embargo, los servicios para estudiantes y el proceso de revisión de proyectos de Udacity son tan efectivos para el aprendizaje que tomaría el programa Data Analyst Nanodegree independientemente.

Si usted es el tipo de persona que desea una experiencia de educación en línea 100% personalizada, pero quiere aprovechar los proyectos y servicios de Udacity, busque sus cursos favoritos para cada materia (recomiendo usar Class Central) y luego inscríbase en el programa Nanodegree para completar los proyectos es algo a considerar.

Las alternativas

Estos son los cinco programas alternativos que estaba considerando cuando me inscribí en el programa Data Analyst Nanodegree:

  • Especialización en ciencia de datos de la Universidad Johns Hopkins en Coursera
  • Certificado del programa profesional de Microsoft en ciencia de datos en edX
  • Especialización en interpretación y análisis de datos de Wesleyan University en Coursera
  • Pistas de Python y R de DataCamp
  • Rutas de Data Analyst y Data Scientist de Dataquest

Nota: He eliminado mis comentarios sobre estos programas debido a la política de Udacity con respecto a comentar sobre otros proveedores.

Conclusión

El programa Data Analyst Nanodegree de Udacity le brinda las habilidades fundamentales que necesita para una carrera en ciencia de datos. Después de la graduación, podrá enfocarse en sus fortalezas y debilidades, y complementar su aprendizaje cuando sea necesario. Además, se irá con un puñado de proyectos listos para el portafolio.

Me encantó, al igual que otros.

★★★★ ¾