Los mejores cursos de ciencia de datos en Internet, clasificados según sus reseñas

Hace año y medio, dejé uno de los mejores programas de informática en Canadá. Comencé a crear mi propio programa de maestría en ciencia de datos utilizando recursos en línea. Me di cuenta de que podía aprender todo lo que necesitaba a través de edX, Coursera y Udacity. Y pude aprenderlo más rápido, de manera más eficiente y por una fracción del costo.

Ya casi he terminado. He tomado muchos cursos relacionados con la ciencia de datos y auditado partes de muchos más. Conozco las opciones que existen y las habilidades que se necesitan para los estudiantes que se preparan para un rol de analista de datos o científico de datos.Así que comencé a crear una guía basada en revisiones que recomienda los mejores cursos para cada tema dentro de la ciencia de datos.

Para la primera guía de la serie, recomendé algunas clases de codificación para el científico de datos principiante. Luego fueron estadísticas y clases de probabilidad. Luego, introducciones a la ciencia de datos. Luego visualización de datos. El aprendizaje automático fue la quinta y última guía. Y ahora vuelvo para concluir esta serie con aún más recursos.

Aquí hay un resumen de todas mis guías anteriores, además de recomendaciones para otros 13 temas de ciencia de datos.

Para cada una de las cinco guías principales de esta serie, pasé varias horas tratando de identificar todos los cursos en línea para el tema en cuestión, extrayendo bits de información clave de sus programas y reseñas, y compilando sus calificaciones. Mi objetivo era identificar los tres mejores cursos disponibles para cada tema y presentárselos.

Los 13 temas complementarios, como bases de datos, big data e ingeniería de software en general, no tenían suficientes cursos para justificar guías completas. Pero durante los últimos ocho meses, los seguí a medida que los encontraba. También busqué en Internet cursos que me hubiera perdido.

Para estas tareas, recurrí nada menos que a la comunidad de código abierto Class Central y su base de datos de miles de calificaciones y reseñas de cursos.

Desde 2011, el fundador de Class Central, Dhawal Shah, ha estado más atento a los cursos en línea que posiblemente cualquier otra persona en el mundo. Dhawal personalmente me ayudó a armar esta lista de recursos.

Cómo elegimos los cursos para considerar

Cada curso dentro de cada guía debe cumplir con ciertos criterios. Había criterios específicos de la asignatura, luego dos comunes que compartía cada guía:

  1. Debe ser bajo demanda u ofrecerse cada pocos meses.
  2. Debe ser un curso interactivo en línea, por lo que no se permiten libros ni tutoriales de solo lectura. Aunque estas son formas viables de aprender, esta guía se centra en los cursos. También se excluyen los cursos que son estrictamente videos (es decir, sin exámenes, tareas, etc.).

Creemos que cubrimos todos los cursos destacados que se ajustan a los criterios de cada guía. Sin embargo, siempre existe la posibilidad de que nos hayamos perdido algo. Háganos saber en la sección de comentarios de cada guía si dejamos un buen curso.

Cómo evaluamos los cursos

Compilamos calificaciones promedio y el número de revisiones de Class Central y otros sitios de revisión para calcular una calificación promedio ponderada para cada curso. Leímos reseñas de texto y usamos estos comentarios para complementar las calificaciones numéricas.

Hicimos juicios subjetivos del programa de estudios basados ​​en una variedad de factores específicos de cada materia. Los criterios de nuestra guía de introducción a la programación, por ejemplo:

  1. Cobertura de los fundamentos de la programación.
  2. Cobertura de temas de programación más avanzados, pero útiles.
  3. ¿Qué parte del programa de estudios es relevante para la ciencia de datos?

Aquí están los mejores cursos en general para cada uno de estos temas. Juntos, forman un plan de estudios completo de ciencia de datos.

Asunto # 1: Introducción a la programación

Learn to Program: The Fundamentals (LPT1) y Crafting Quality Code (LPT2) por la Universidad de Toronto a través de Coursera

La serie Learn to Program de la Universidad de Toronto tiene una excelente combinación de dificultad de contenido y alcance para el científico de datos principiante. Impartida en Python, la serie tiene una calificación promedio ponderada de 4.71 estrellas sobre 284 reseñas.

Introducción a la programación interactiva en Python (Parte 1) y (Parte 2) por Rice University a través de Coursera

La serie Programación interactiva en Python de Rice University contiene dos de los mejores cursos en línea de la historia. Se inclinan hacia los juegos y las aplicaciones interactivas, que son temas menos aplicables en la ciencia de datos. La serie tiene una calificación promedio ponderada de 4.93 estrellas sobre 6.069 reseñas.

Pista de programación R por DataCamp

Si está decidido a aprender R, la pista de programación R de DataCamp combina de manera efectiva los fundamentos de programación y la instrucción de sintaxis R. Tiene una calificación promedio ponderada de 4.29 estrellas sobre 14 reseñas.

Materia # 2: Estadística y probabilidad

Fundamentos del análisis de datos - Parte 1: Estadísticas con R y Parte 2: Estadísticas inferenciales por la Universidad de Texas en Austin a través de edX

Los cursos de la serie Fundamentos del análisis de datos de UT Austin son dos de los pocos con excelentes reseñas que también enseñan estadística y probabilidad con un enfoque en la codificación de ejemplos. La serie tiene una calificación promedio ponderada de 4.61 estrellas sobre 28 reseñas.

Estadísticas con especialización R de la Universidad de Duke a través de Coursera

Estadística de Duke con especialización R, que se divide en cinco cursos, tiene un programa completo con secciones completas dedicadas a la probabilidad. Tiene una calificación promedio ponderada de 3.6 estrellas sobre 5 reseñas, pero el campo en el que se basó tiene una calificación promedio ponderada de 4.77 estrellas sobre 60 reseñas.

Introducción a la probabilidad: la ciencia de la incertidumbre por el Instituto de Tecnología de Massachusetts (MIT) a través de edX

El curso Introducción a la probabilidad del MIT tiene, con mucho, las calificaciones más altas de los cursos considerados en la guía de estadística y probabilidad. Es exclusivamente probable con gran detalle, además de que es más largo (15 semanas) y más desafiante que la mayoría de los MOOC. Tiene una calificación promedio ponderada de 4.82 estrellas sobre 38 reseñas.

Asunto # 3: Introducción a la ciencia de datos

Data Science AZ ™: ejercicios de ciencia de datos de la vida real incluidos por Kirill Eremenko y el equipo de SuperDataScience a través de Udemy

Data Science AZ de Kirill Eremenko se destaca en la amplitud y profundidad de la cobertura del proceso de ciencia de datos. Los revisores elogian con frecuencia la capacidad natural de enseñanza del instructor. Tiene una calificación promedio ponderada de 4.5 estrellas sobre 5.078 reseñas.

Introducción al análisis de datos de Udacity

La Introducción al análisis de datos de Udacity cubre el proceso de ciencia de datos de forma coherente con Python. Tiene una calificación promedio ponderada de 5 estrellas sobre 2 reseñas.

Fundamentos de la ciencia de datos por Big Data University

Los fundamentos de la ciencia de datos de Big Data University cubre el proceso completo de ciencia de datos e introduce Python, R y varias otras herramientas de código abierto. No hay revisiones para este curso en los sitios de revisión utilizados para este análisis.

Asunto # 4: Visualización de datos

Visualización de datos con la especialización de Tableau por la Universidad de California, Davis a través de Coursera

Una serie de cinco cursos, Visualización de datos de UC Davis con la especialización de Tableau profundiza en la teoría de la visualización. Las oportunidades para practicar Tableau se proporcionan a través de tutoriales y un proyecto final. Tiene una calificación promedio ponderada de 4 estrellas sobre 2 reseñas.

Visualización de datos con la serie ggplot2 de DataCamp

Respaldado por el creador de ggplot2 Hadley Wickham, una cantidad sustancial de teoría se cubre en la visualización de datos de DataCamp con la serie ggplot2. Conocerás bastante bien R y su peculiar sintaxis al salir de estos cursos. No hay revisiones para estos cursos en los sitios de revisión utilizados para este análisis.

Serie Tableau 10 (Tableau 10 AZ y Tableau 10 Advanced Training) por Kirill Eremenko y el equipo de SuperDataScience en Udemy

Una introducción práctica eficaz, la serie Tableau 10 de Kirill Eremenko se centra principalmente en la cobertura de herramientas (Tableau) más que en la teoría de visualización de datos. Juntos, los dos campos tienen una calificación promedio ponderada de 4.6 estrellas sobre 3.724 reseñas.

Materia # 5: Aprendizaje automático

Aprendizaje automático de la Universidad de Stanford a través de Coursera

Impartido por el famoso Andrew Ng, fundador de Google Brain y ex director científico de Baidu, el aprendizaje automático de la Universidad de Stanford cubre todos los aspectos del flujo de trabajo del aprendizaje automático y varios algoritmos. Impartido en MATLAB u Octave, tiene una calificación promedio ponderada de 4.7 estrellas sobre 422 reseñas.

Aprendizaje automático de la Universidad de Columbia a través de edX

Una introducción más avanzada que la de Stanford, el aprendizaje automático de la Universidad de CoIumbia es un curso más nuevo con reseñas excepcionales y un instructor reverenciado. Las tareas del curso se pueden completar con Python, MATLAB u Octave. Tiene una calificación promedio ponderada de 4.8 estrellas sobre 10 reseñas.

Machine Learning AZ ™: Python y R prácticos en ciencia de datos por Kirill Eremenko y Hadelin de Ponteves a través de Udemy

Machine Learning AZ de Kirill Eremenko y Hadelin de Ponteves es una oferta impresionantemente detallada que brinda instrucción tanto en Python como en R, lo cual es raro y no se puede decir de ninguno de los otros cursos principales. Tiene una calificación promedio ponderada de 4.5 estrellas sobre 8,119 reseñas.

Materia # 6: Aprendizaje profundo

Aplicaciones creativas de aprendizaje profundo con TensorFlow de Kadenze

Las aplicaciones creativas de aprendizaje profundo de Parag Mital con Tensorflow agregan un giro único a un tema técnico. Las "aplicaciones creativas" son inspiradoras, el curso se produce profesionalmente y el instructor sabe lo que hace. Impartido en Python, tiene una calificación promedio ponderada de 4.75 estrellas sobre 16 reseñas.

Redes neuronales para el aprendizaje automático de la Universidad de Toronto a través de Coursera

Aprenda de una leyenda. Geoffrey Hinton es conocido como el “padrino del aprendizaje profundo” y se distingue internacionalmente por su trabajo en redes neuronales artificiales. Su Neural Networks for Machine Learning es una clase avanzada. Impartido en Octave con ejercicios también en Python, tiene una calificación promedio ponderada de 4.11 estrellas sobre 35 reseñas.

Deep Learning AZ ™: redes neuronales artificiales prácticas de Kirill Eremenko y Hadelin de Ponteves a través de Udemy

Deep Learning AZ es una introducción accesible al aprendizaje profundo, con explicaciones intuitivas de Kirill Eremenko y demostraciones de código útiles de Hadelin de Ponteves. Impartido en Python, tiene una calificación promedio ponderada de 4.6 estrellas sobre 1314 reseñas.

Y aquí está nuestra selección de cursos superior para cada una de las materias complementarias dentro de la ciencia de datos.

Python y sus herramientas

Pista de programación de Python de DataCamp, más sus cursos de pandas individuales:

  • fundaciones de pandas
  • Manipular DataFrames con pandas
  • Fusionando DataFrames con pandas

El estilo de instrucción con mucho código de DataCamp y el entorno de programación en el navegador son excelentes para aprender la sintaxis. Sus cursos de Python tienen una calificación promedio ponderada de 4.64 estrellas sobre 14 reseñas. Introducción al análisis de datos de Udacity, una de nuestras recomendaciones para la introducción a los cursos de ciencia de datos, también cubre NumPy y pandas.

R & sus herramientas

R Programming Track de DataCamp, más sus cursos individuales de dplyr y data.table:

  • Manipulación de datos en R con dplyr
  • Uniendo datos en R con dplyr
  • Análisis de datos en R, el método data.table

Nuevamente, el estilo de instrucción con mucho código de DataCamp y el entorno de programación en el navegador son excelentes para aprender la sintaxis. Su R Programming Track, que también es una de nuestras recomendaciones para los cursos de programación en general, combina de manera efectiva los fundamentos de la programación y la instrucción de sintaxis R. La serie tiene una calificación promedio ponderada de 4.29 estrellas sobre 14 reseñas.

Bases de datos y SQL

Introducción a las bases de datos de la Universidad de Stanford a través de Stanford OpenEdx (nota: reseñas de la versión obsoleta en Coursera)

La Introducción a las bases de datos de la Universidad de Stanford cubre la teoría de las bases de datos de manera integral al tiempo que presenta varias herramientas de código abierto. Los ejercicios de programación son un desafío. Jennifer Widom, ahora decana de la Escuela de Ingeniería de Stanford, es clara y precisa. Tiene una calificación promedio ponderada de 4.61 estrellas sobre 59 reseñas.

Preparación de datos

Importación y limpieza de pistas de datos por DataCamp:

  • Importación y limpieza de datos con Python Track
  • Importación y limpieza de datos con R Track

Las pistas de importación y limpieza de datos de DataCamp (una en Python y otra en R) se destacan en la enseñanza de la mecánica de preparar sus datos para su análisis y / o visualización. No hay revisiones para estos cursos en los sitios de revisión utilizados para este análisis.

Análisis exploratorio de datos

Análisis de datos con R por Udacity y Facebook

El análisis de datos de Udacity con R es una introducción agradable al análisis de datos exploratorios. Las entrevistas de expertos con los científicos de datos de Facebook son reveladoras e inspiradoras. El curso tiene una calificación promedio ponderada de 4.58 estrellas sobre 19 reseñas. También sirve como una ligera introducción a R.

Big Data

El Hadoop práctico definitivo: ¡domine sus macrodatos! por Frank Kane a través de Udemy, entonces, si quieres más sobre herramientas específicas (todas de Frank Kane a través de Udemy):

  • Domesticar Big Data con Apache Spark y Python: ¡manos a la obra!
  • Domesticar Big Data con MapReduce y Hadoop: ¡manos a la obra!
  • Apache Spark 2.0 con Scala: ¡manos a la obra con Big Data!
  • Domesticar Big Data con Spark Streaming y Scala: ¡manos a la obra!

La serie Big Data de Frank Kane enseña todas las tecnologías de big data más populares, incluidas más de 25 en el curso "Ultimate" solo. Kane comparte su conocimiento de una década de experiencia en la industria trabajando con sistemas distribuidos en Amazon e IMDb. Juntos, los campos tienen una calificación promedio ponderada de 4.52 estrellas sobre 6,932 reseñas.

Habilidades de software

Pruebas de software de Udacity

Depuración de software por Udacity

Control de versiones con Git y GitHub y colaboración de Udacity (actualizaciones del popular curso Cómo usar Git y GitHub de Udacity)

Las habilidades de software son una parte que a menudo se pasa por alto en la educación en ciencia de datos. Los cursos de prueba, depuración y control de versiones de Udacity presentan tres temas centrales relevantes para cualquiera que se ocupe de código, especialmente aquellos en entornos basados ​​en equipos. Juntos, los campos tienen una calificación promedio ponderada de 4.34 estrellas sobre 68 reseñas. Georgia Tech y Udacity tienen un nuevo curso que cubre las pruebas de software y la depuración en conjunto, aunque es más avanzado y no del todo relevante para los científicos de datos.

Diverso

Creación de un equipo de ciencia de datos por la Universidad Johns Hopkins a través de Coursera

Aprender a aprender: poderosas herramientas mentales para ayudarlo a dominar materias difíciles por la Dra. Barbara Oakley y la Universidad de California, San Diego a través de Coursera

Mindshift: Supere los obstáculos para aprender y descubra su potencial oculto por la Dra. Barbara Oakley y la Universidad McMaster a través de Coursera

La construcción de un equipo de ciencia de datos de la Universidad Johns Hopkins ofrece un vistazo útil a la ciencia de datos en la práctica. Es un curso extremadamente corto que puede completarse en unas pocas horas y auditarse de forma gratuita. Ignore su calificación promedio ponderada de 3.41 estrellas en 12 reseñas, algunas de las cuales probablemente provienen de clientes que pagan.

Learning How to Learn y Mindshift de la Dra. Barbara Oakley no son cursos de ciencia de datos per se. Aprender a aprender, el curso en línea más popular de la historia, cubre las mejores prácticas que las investigaciones demuestran que son más efectivas para dominar temas difíciles, incluidas las técnicas de memoria y el manejo de la procrastinación. En Mindshift, demuestra cómo aprovechar al máximo el aprendizaje en línea y los MOOC, cómo buscar mentores y trabajar con ellos, y los secretos para evitar las rutinas profesionales y las rutinas generales de la vida. Estos son dos cursos que todos deberían tomar. Tienen una calificación promedio ponderada de 4.74 estrellas y 4.87 estrellas sobre 959 y 407 reseñas, respectivamente. Ambos cursos tienen una duración de cuatro semanas.

Este futuro de esta guía

Esta Guía de carrera de ciencia de datos seguirá actualizándose a medida que se publiquen nuevos cursos y se generen calificaciones y revisiones para ellos.

¿Te apasiona otra disciplina (por ejemplo, informática)? ¿Le gustaría ayudar a educar al mundo? Si está interesado en crear una Guía de carrera similar en estructura a esta, envíenos una nota a [email protected]

Mi futuro

En cuanto a mi futuro, estoy emocionado de compartir que he asumido un puesto en Udacity como desarrollador de contenido. Eso significa que estaré creando y enseñando cursos. Eso también significa que otra persona actualizará esta guía.

Me uniré a Udacity porque creo que están mejor posicionados para crear el mejor producto educativo del planeta. De todos los cursos que he tomado, en línea o en la universidad, aprendí mejor mientras me inscribí en un Nanogrado. Están incorporando lo último en pedagogía y producción y cuentan con un excelente sistema de revisión de proyectos, instructores optimistas y equipos de apoyo profesional y para estudiantes saludables. Aunque un enfoque por partes como el que tomamos en esta guía puede funcionar, un programa coherente con proyectos y revisiones es mucho más amigable para los estudiantes.

Actualizar el Nanodegree de Data Analyst es mi primera tarea, que es parte de un esfuerzo mayor para crear una ruta clara de Nanodegrees para todos los datos. Los estudiantes pronto podrán comenzar desde cero con los conceptos básicos de datos en Udacity y progresar a través del aprendizaje automático, la inteligencia artificial e incluso los autos sin conductor si lo desean.

Envolviendolo

Esta es la pieza final de una serie de seis piezas que cubre los mejores cursos en línea para iniciarse en el campo de la ciencia de datos. Cubrimos programación en el primer artículo, estadística y probabilidad en el segundo artículo, intros a la ciencia de datos en el tercer artículo, visualización de datos en el cuarto y aprendizaje automático en el quinto.

Todos los cursos de aprendizaje automático en Internet, clasificados según sus reseñas

medium.freecodecamp.com

Aquí, resumimos los cinco artículos anteriores y recomendamos los mejores cursos en línea para otros temas clave como bases de datos, big data e incluso ingeniería de software.

Si está buscando una lista completa de cursos en línea de Data Science, puede encontrarlos en la página de materias de Data Science y Big Data de Class Central.

Si disfrutó leyendo esto, vea algunas de las otras piezas de Class Central:

Aquí hay 250 cursos de la Ivy League que puede tomar en línea ahora mismo de forma gratuita

250 MOOC de Brown, Columbia, Cornell, Dartmouth, Harvard, Penn, Princeton y Yale. medium.freecodecamp.com Los 50 mejores cursos universitarios online gratuitos según datos

Cuando lancé Class Central en noviembre de 2011, había alrededor de 18 cursos en línea gratuitos, y casi todos de… medium.freecodecamp.com

Si le resultó útil, haga clic en? para que más gente lo vea aquí en Medium.

Esta es una versión modificada de mi artículo original publicado en Class Central, donde también se proporciona una lista simple de los cursos mencionados aquí.