Una descripción general de cada curso de visualización de datos en Internet

Hace un año, dejé uno de los mejores programas de ciencias de la computación en Canadá. Comencé a crear mi propio programa de maestría en ciencia de datos utilizando recursos en línea. Me di cuenta de que podía aprender todo lo que necesitaba a través de edX, Coursera y Udacity. Y pude aprenderlo más rápido, de manera más eficiente y por una fracción del costo.

Ya casi he terminado. He tomado muchos cursos relacionados con la ciencia de datos y auditado porciones de muchos más. Conozco las opciones que existen y las habilidades que se necesitan para los estudiantes que se preparan para un rol de analista de datos o científico de datos. Hace unos meses, comencé a crear una guía basada en revisiones que recomienda los mejores cursos para cada tema dentro de la ciencia de datos.

Para la primera guía de la serie, recomendé algunas clases de codificación para el científico de datos principiante. Luego fueron estadísticas y clases de probabilidad. Luego fueron las introducciones a la ciencia de datos en sí.

Pasemos ahora a la visualización de datos.

Para esta guía, pasé más de 10 horas tratando de identificar todos los cursos de visualización de datos en línea ofrecidos a partir de marzo de 2017, extrayendo bits de información clave de sus programas de estudio y reseñas, y compilando sus calificaciones. Para esta tarea, recurrí nada menos que a la comunidad de código abierto Class Central y su base de datos de miles de calificaciones y reseñas de cursos.

Desde 2011, el fundador de Class Central, Dhawal Shah, ha estado más atento a los cursos en línea que posiblemente cualquier otra persona en el mundo. Dhawal personalmente me ayudó a armar esta lista de recursos.

Cómo elegimos los cursos para considerar

Cada curso debe cumplir con tres criterios:

  1. La mayor parte del curso debe centrarse en la visualización de datos explicativos . La cobertura de la preparación de datos, por ejemplo, está permitida dado que es una parte importante del proceso de visualización de datos. Se excluyen los cursos que cubren temas menos relevantes (modelado estadístico, por ejemplo). Más sobre la distinción explicativa a continuación.
  2. Debe ser bajo demanda u ofrecerse cada pocos meses.
  3. Debe ser un curso interactivo en línea, por lo que no se permiten libros ni tutoriales de solo lectura . Aunque estas son formas viables de aprender, esta guía se centra en los cursos.

Creemos que cubrimos todos los cursos notables que se ajustan a los criterios anteriores. Dado que aparentemente hay cientos de cursos en Udemy, elegimos considerar solo los más revisados ​​y mejor calificados. Sin embargo, siempre existe la posibilidad de que nos perdiéramos algo, así que háganos saber en la sección de comentarios si dejamos un buen curso.

Cómo evaluamos los cursos

Compilamos la calificación promedio y el número de revisiones de Class Central y otros sitios de revisión para calcular una calificación promedio ponderada para cada curso. Leímos reseñas de texto y usamos estos comentarios para complementar las calificaciones numéricas.

Hicimos juicios subjetivos sobre el programa de estudios basados ​​en dos factores, dando preferencia al primero sobre el segundo:

  1. Cobertura de la teoría de visualización de datos. ¿Se explican las motivaciones para las opciones de visualización? ¿El curso solo enseña la herramienta? Más sobre esto en la siguiente sección.
  2. Cobertura de las herramientas de visualización de datos elegidas. ¿El curso enseña de forma eficaz herramientas de visualización comunes (Tableau, ggplot2, Seaborn, etc.)? ¿Tienen los estudiantes oportunidades para practicar estas habilidades? No se da preferencia por la elección de herramientas.

Por qué priorizar la teoría de la visualización

El dominio de una herramienta específica es un desperdicio sin el conocimiento de los fundamentos de una visualización eficaz. Además, las herramientas suelen ser intercambiables según el entorno.

Más importante aún, hacer una buena visualización de datos es más complejo de lo que la mayoría de la gente piensa. Se requiere una reflexión cuidadosa desde las etapas de planificación hasta la ejecución. Elegir el gráfico correcto, equilibrar la complejidad y el desorden, aprovechar las propiedades de atención previa y más, la visualización de datos es un arte y una ciencia. Es fácil equivocarse y, a veces, horriblemente (ver más abajo).

Visualización exploratoria vs.explicativa

Como lo describe el profesor de la Universidad de Indiana, Yong-Yeol Ahn, el objetivo de la visualización de datos explicativos es comunicar ideas y mensajes, mientras que el objetivo de la visualización exploratoria es descubrir patrones ocultos.

Este artículo se centra en cursos explicativos de visualización de datos. Por lo tanto, los cursos como el Análisis de datos con R de Udacity (exclusivamente un curso exploratorio) están excluidos de este artículo. El tema es importante; simplemente no hay suficientes cursos para justificar un artículo independiente. Se tratará brevemente en el artículo de resumen de esta serie.

A veces se requiere experiencia en codificación

Algunos de los cursos enumerados a continuación requieren habilidades básicas de codificación en el idioma de instrucción del curso. Si tiene muy poca experiencia en programación, nuestras recomendaciones en el primer artículo de esta serie, la mejor introducción a los cursos de programación para ciencia de datos, sería un gran comienzo. Se cubren los cursos de Python y R.

Revisar datos que faltan

En comparación con los otros artículos de esta serie, hay una falta de datos de revisión para los cursos de visualización de datos que se ajustan a los criterios anteriores. Tampoco existe todavía un curso claro sobre la mejor visualización de datos. Por lo tanto, las recomendaciones siguientes no son tan concluyentes como los artículos anteriores. Como siempre, pero especialmente aquí, intente elegir el curso que mejor se adapte a sus necesidades.

Nuestra elección para el mejor curso de visualización de datos es ...

  • Visualización de datos con la especialización de Tableau de la Universidad de California, Davis en Coursera

… Que contiene los siguientes cinco cursos:

  • Fundamentos de visualización con Tableau
  • Principios de diseño esenciales para Tableau
  • Análisis visual con Tableau
  • Creación de paneles y narraciones con Tableau
  • Visualización de datos con Tableau Project

La visualización de datos de Davis con la especialización de Tableau de la Universidad de California, tiene la mejor combinación de cobertura de teoría y herramientas disponible según los criterios de evaluación de este artículo. Se sumerge profundamente en la teoría como pocos otros cursos. Hay oportunidades para practicar Tableau a través de tutoriales y un proyecto final, aunque dominar Tableau no es el objetivo principal. Es una especialización bastante nueva (finales de 2016) y los cursos solo tienen una calificación de 4 estrellas entre ellos en los sitios de revisión utilizados para este análisis.

Govind Acharya, Hunter Whitney y Suk Brar son los instructores. Acharya es analista principal en UC Davis. Whitney y Brar son profesionales respetados de la industria. Entre ellos, tienen décadas de experiencia en visualización de datos que se transmite claramente a través del contenido del curso. Los videos están bien producidos.

El plazo estimado para la especialización en Coursera es de 22 semanas con compromisos semanales que oscilan entre tres y ocho horas por semana. Estas estimaciones son seguramente demasiado altas, como señalaron varios revisores y mi experiencia con Coursera. Las opciones gratuitas (auditando cada curso individualmente) y pagadas (pagando por la especialización) están disponibles actualmente.

Varios críticos destacados de Coursera señalaron lo siguiente:

No solo te dicen cómo hacer el diseño de visualización, sino que también te dicen por qué (la fisiología, los principios). Recomiendo encarecidamente esta clase.Gran curso: protege contra algunos errores sutiles en la preparación de la visualización.Aunque es una introducción muy básica al uso de Tableau, el curso proporciona una base amplia e interesante que debería resultar útil para cualquiera que busque mejorar su comprensión de fundamentos de visualización.

Teoría de visualización y R, aprendidas haciendo

  • Visualización de datos con ggplot2 por DataCamp

... para lo cual hay tres partes:

  • Visualización de datos con ggplot2 (Parte 1)
  • Visualización de datos con ggplot2 (Parte 2)
  • Visualización de datos con ggplot2 (Parte 3)

Otra gran opción es la visualización de datos de DataCamp con la serie ggplot2, especialmente si desea aprender R y, más específicamente, ggplot2. Se cubre una cantidad sustancial de teoría, lo cual es apropiado dado que ggplot2 está inspirado en The Grammar of Graphics. La cobertura de herramientas y la práctica también son impresionantes: conocerá R y su sintaxis peculiar bastante bien al salir de estos cursos. No hay revisiones para estos cursos en los sitios de revisión utilizados para este análisis.

El instructor de los tres cursos es Rick Scavetta, que es biólogo, capacitador de talleres, científico de datos independiente y cofundador de Science Craft. El estilo de enseñanza híbrido de DataCamp aprovecha el video (protagonizado por Scavetta) y la instrucción basada en texto con muchos ejemplos a través de un editor de código en el navegador. El contenido de video, texto y código está muy bien pulido.

Juntos, el cronograma estimado para los tres cursos es de 16 horas. El primer capítulo de cada curso está disponible de forma gratuita. Se requiere una suscripción a DataCamp, que actualmente cuesta $ 29 por mes o $ 300 por año, para tener acceso completo.

El siguiente respaldo es de Hadley Wickham, científico jefe de RStudio y creador de ggplot2:

Recomiendo ampliamente "Visualización de datos con ggplot2" de Rick Scavetta. Le brinda una excelente introducción a ggplot2. Aprenderá tanto la teoría subyacente como la práctica práctica en el entorno de aprendizaje en línea de DataCamp.

Una introducción práctica a Tableau con un excelente instructor

Tableau 10 Series de Kirill Eremenko y el equipo de SuperDataScience en Udemy, que incluye:

  • Tableau 10 AZ: capacitación práctica de Tableau para ciencia de datos
  • Capacitación avanzada de Tableau 10: Master Tableau en ciencia de datos

Impartido por Kirill Eremenko, Tableau 10 Series de SuperDataScience es una introducción práctica y eficaz. Se centra principalmente en la cobertura de herramientas (Tableau) más que en la teoría de visualización de datos. Eremenko es uno de los instructores mejor considerados en estas guías con críticas consistentemente positivas en todos sus cursos. El curso AZ es un requisito previo para el curso de formación avanzada. Juntos, los campos de la serie tienen una calificación promedio ponderada de 4.6 estrellas sobre 3.724 reseñas.

La serie tiene diecisiete horas de contenido de video. El costo de cada curso varía según los descuentos de Udemy, pero estos son frecuentes y se pueden comprar por tan solo $ 10.

Varios revisores destacados señalaron lo siguiente:

Esto fue genial. Yo uso diario Tableau pero fue un repaso impresionante en algunos de los artículos que no hayan utilizado y una gran ayuda al estudio para presentarse al examen Tableau Certified Professional. ¡Buen trabajo Kirill y el equipo!

Kirill es un gran maestro y los estudiantes que tomen este curso verán claramente por qué tiene docenas de cursos y miles de estudiantes: es capaz de enseñar habilidades complejas, en un contexto empresarial del mundo real y hacerlo de manera incremental, combinando así la tarea a menudo compleja de enseñar tanto fundamentos y aplicaciones específicas del contexto simultáneamente.

La competencia

Veamos las otras alternativas, ordenadas por calificación descendente.

Visualización interactiva de datos con Python y Bokeh (Ardit Sulce / Udemy): Enfoque de herramientas (Python y Bokeh). Incluye una sección sobre la creación de aplicaciones web. Siete horas de video. El costo varía según los descuentos de Udemy, que son frecuentes. Tiene una calificación promedio ponderada de 4.6 estrellas sobre 103 reseñas.

Visualización de información (IVMOOC) (Universidad de Indiana / Independiente): cubre la teoría y múltiples herramientas con gran detalle. Impresionante proyecto de la vida real. El registro no funcionó cuando se intentó a pesar de los correos electrónicos enviados a los administradores del curso. Un curso de posgrado completo de doce semanas. Gratis. Tiene una calificación promedio ponderada de 4.5 estrellas sobre 2 reseñas.

Tableau para principiantes: obtenga la certificación Acelere su carrera (Lukas Halim / Udemy): enfoque en las herramientas (Tableau). Cuatro horas de video. El costo varía según los descuentos de Udemy, que son frecuentes. Tiene una calificación promedio ponderada de 4.5 estrellas sobre 649 reseñas.

Análisis y visualización de datos con Power BI (Microsoft / edX): enfoque de herramientas (Power BI). Diseñado para usuarios empresariales que invierten en el ecosistema de Microsoft. Parte del Certificado del programa profesional de Microsoft en ciencia de datos. Cronograma estimado de dos a cuatro horas por semana durante seis semanas. Gratis con un certificado verificado disponible para su compra. Tiene una calificación promedio ponderada de 4.5 estrellas sobre 117 reseñas.

Analizar y visualizar datos con Excel (Microsoft / edX): Herramienta de enfoque (Excel). Diseñado para usuarios empresariales que invierten en el ecosistema de Microsoft. Parte del Certificado del Programa Profesional de Microsoft en Ciencia de Datos. Cronograma estimado de dos a cuatro horas por semana durante seis semanas. Gratis con un certificado verificado disponible para su compra. Tiene una calificación promedio ponderada de 4.5 estrellas sobre 972 reseñas.

Datos Visualice datos con D3.js The Easy Way (Infinite Skills / Udemy): enfoque de herramientas (D3.js). Cuatro horas de video. El costo varía según los descuentos de Udemy, que son frecuentes. Tiene una calificación promedio ponderada de 4.4 estrellas sobre 262 reseñas.

Visualización de datos con Python y Matplotlib (Stone River eLearning / Udemy): enfoque de herramientas (Python y Matplotlib). Seis horas de video. El costo varía según los descuentos de Udemy, que son frecuentes. Tiene una calificación promedio ponderada de 4.4 estrellas sobre 92 reseñas.

Análisis de datos: visualización y diseño de tableros (Delft University of Technology / edX): herramienta (Excel) y enfoque empresarial. Cronograma estimado de cuatro a seis horas por semana durante seis semanas. Gratis con un certificado verificado disponible para su compra. Tiene una calificación promedio ponderada de 4.2 estrellas sobre 5 reseñas.

Big Data: visualización de datos (Queensland University of Technology / FutureLearn): enfoque equilibrado de teoría / herramienta. Exposición a una variedad de herramientas. Comienza en agosto de 2017. Cronograma estimado de dos horas por semana durante tres semanas. Gratis con una "actualización" disponible para su compra. Tiene una calificación de 4 estrellas sobre 1 revisión.

Visualización de datos y comunicación con Tableau (Duke University / Coursera): herramienta (Tableau) y enfoque empresarial. Parte de Excel to MySQL: Técnicas analíticas para la especialización empresarial. Cronograma estimado de seis a ocho horas por semana durante cinco semanas. Opciones gratuitas y de pago disponibles. Tiene una calificación promedio ponderada de 3.67 estrellas sobre 9 reseñas.

Visualización de datos (Universidad de Illinois en Urbana-Champaign / Coursera): enfoque teórico. Parte de la especialización en minería de datos. Cronograma estimado de cuatro a seis horas por semana durante cuatro semanas. Opciones gratuitas y de pago disponibles. Tiene una calificación promedio ponderada de 3.14 estrellas en 22 reseñas.

Visualización de datos y D3.js (Udacity): enfoque equilibrado de teoría / herramienta. La instrucción D3.js se siente "incompleta" y "fuera de lugar". Cronograma estimado de siete semanas. Gratis. Tiene una calificación promedio ponderada de 2.83 estrellas sobre 6 reseñas.

Gestión y visualización de datos (Wesleyan University / Coursera): enfoque equilibrado de teoría / herramienta. Cubre múltiples herramientas (Python y SAS). Parte de la especialización en interpretación y análisis de datos de Wesleyan. Cronograma estimado de cuatro a cinco horas por semana durante cuatro semanas. Opciones gratuitas y de pago disponibles. Tiene una calificación promedio ponderada de 2.67 estrellas sobre 6 reseñas.

Representación de gráficos, gráficos y datos aplicados en Python (Universidad de Michigan / Coursera): teoría equilibrada y enfoque de herramientas. Opciones gratuitas y de pago disponibles. Tiene una calificación promedio ponderada de 2 estrellas sobre 4 reseñas.

Los siguientes cursos no tuvieron revisiones hasta marzo de 2017.

Visualización de datos en Tableau (Udacity): enfoque teórico con excelente cobertura. Breve cobertura de herramientas (Tableau). Instrucción principalmente basada en texto con pruebas de opción múltiple. Parte de Nanodegree de analista de datos de Udacity y Nanodegree de análisis predictivo para empresas. Es probable que este curso esté destinado a los tres primeros lugares cuando se actualice con videos para complementar el texto. Cronograma estimado de tres semanas. Gratis.

Herramientas de visualización de datos de construcción (Universidad Johns Hopkins / Coursera): enfoque de la herramienta (R y ggplot2). Parte del desarrollo de software de masterización de JHU en especialización R. Cronograma estimado de dos horas por semana durante cuatro semanas. Opciones gratuitas y de pago disponibles.

Visualización de datos para todos (Trinity College / edX): enfoque teórico. Cronograma estimado de tres horas por semana durante seis semanas. Gratis con certificado verificado disponible para su compra.

Visualización de datos con Excel avanzado (PwC / Coursera): Enfoque de herramienta (Excel). Parte de las habilidades de presentación y análisis de datos de PwC: la especialización del enfoque de PwC. Cronograma estimado de tres a cuatro horas por semana durante cuatro semanas. Opciones gratuitas y de pago disponibles.

Comunicación de resultados de análisis de negocios (Universidad de Colorado Boulder / Coursera): Teoría y enfoque comercial. Parte del Bootcamp de análisis de datos para empresas de Colorado Boulder. Cronograma estimado de cuatro semanas. Opciones gratuitas y de pago disponibles.

Narración de historias a través de la visualización de datos (Dataquest): principalmente un enfoque de herramientas (Python, Matplotlib y Seaborn). El cronograma estimado no está claro. Mayormente gratis, pero se requiere una suscripción para tener acceso completo.

Ruta de aprendizaje de visualización de datos (O'Reilly): herramienta equilibrada / enfoque teórico. Cubre D3.js. Varios instructores. Quince horas de contenido. Gratis con una prueba gratuita de diez días.

Visualización de datos para desarrolladores (Dan Appleman / Pluralsight): enfoque teórico. Diseñado para desarrolladores. Dos horas de contenido. Gratis con una prueba gratuita de diez días.

Los siguientes cuatro cursos fueron creados por Bill Shander de Beehive Media y se ofrecen en Lynda. Se enumeran en orden cronológico por fecha de lanzamiento.

Fundamentos de visualización de datos (Bill Shander / Lynda): Enfoque teórico. Cuatro horas de contenido. Gratis con una prueba gratuita de diez días.

Diseño de una visualización de datos (Bill Shander / Lynda): enfoque teórico. Abarca la creación de un proyecto específico desde el concepto hasta el análisis de datos, el diseño y la ejecución. Cuatro horas de contenido. Gratis con una prueba gratuita de diez días.

Visualización de datos para analistas de datos (Bill Shander / Lynda): enfoque teórico. Diseñado para analistas de datos. Dos horas de contenido. Gratis con una prueba gratuita de diez días.

Conceptos básicos de narración de historias de visualización de datos (Bill Shander / Lynda): enfoque teórico Dos horas de contenido. Gratis con una prueba gratuita de diez días.

Visualización en R, de principiante a avanzado (Nathan Yau / FlowingData): un curso de cuatro semanas. Se requiere suscripción.

DataCamp ofrece los siguientes cuatro cursos. Como se señaló anteriormente, el estilo de enseñanza híbrido de DataCamp aprovecha la instrucción basada en video y texto con muchos ejemplos a través de un editor de código en el navegador.

Visualización de datos en R (DataCamp): enfoque equilibrado de teoría / herramienta. Cubre gráficos base R. Cronograma estimado de cuatro horas. Se requiere suscripción para tener acceso completo.

Introducción a la visualización de datos con Python (DataCamp): enfoque de herramientas (Python, Matplotlib y Seaborn). Cronograma estimado de cuatro horas. Se requiere suscripción para tener acceso completo.

Visualización interactiva de datos con Bokeh (DataCamp): enfoque de herramienta (Python y Bokeh). Cronograma estimado de cuatro horas. Se requiere suscripción para tener acceso completo.

Visualización de datos en R con ggvis (DataCamp): enfoque equilibrado de teoría / herramienta. Cubre R y ggvis. Cronograma estimado de cuatro horas. Se requiere suscripción para tener acceso completo.

Envolviendolo

Este es el cuarto de una serie de seis piezas que cubre los mejores cursos en línea para iniciarse en el campo de la ciencia de datos. Cubrimos la programación en el primer artículo, la estadística y la probabilidad en el segundo artículo, y las introducciones a la ciencia de datos en el tercer artículo. El resto de la serie cubrirá otras competencias básicas de la ciencia de datos. El siguiente es el aprendizaje automático.

Si desea aprender ciencia de datos, comience con una de estas clases de programación

medium.freecodecamp.com Si desea aprender ciencia de datos, tome algunas de estas clases de estadística

medium.freecodecamp.com Clasifiqué todos los cursos de Introducción a la ciencia de datos en Internet, según miles de puntos de datos

medium.freecodecamp.com

La pieza final será un resumen de esos artículos, además de los mejores cursos en línea para otros temas clave como la lucha de datos, bases de datos e incluso ingeniería de software.

Si está buscando una lista completa de cursos en línea de Data Science, puede encontrarlos en la página de materias de Data Science y Big Data de Class Central.

Si disfrutó leyendo esto, vea algunas de las otras piezas de Class Central:

Aquí hay 250 cursos de la Ivy League que puede tomar en línea ahora mismo de forma gratuita

250 MOOC de Brown, Columbia, Cornell, Dartmouth, Harvard, Penn, Princeton y Yale. medium.freecodecamp.com Los 50 mejores cursos universitarios online gratuitos según datos

Cuando lancé Class Central en noviembre de 2011, había alrededor de 18 cursos en línea gratuitos, y casi todos de… medium.freecodecamp.com

Si tiene sugerencias de cursos que me perdí, ¡hágamelo saber en las respuestas!

Si le resultó útil, haga clic en? para que más gente lo vea aquí en Medium.

Esta es una versión condensada de mi artículo original publicado en Class Central, donde he incluido más descripciones de cursos, programas de estudios y varias revisiones.