Cómo crear un portafolio de ciencia de datos impresionante

Si la sección de habilidades de tu currículum incluye Python, R, SQL, Machine Learning, Deep Learning y te preguntas por qué te rechazan cada vez, sigue leyendo.

Hay millones de personas que buscan trabajo en ciencia de datos y las oportunidades son limitadas. Entonces, la pregunta importante es ¿cómo puede diferenciarse del resto?

La guía intenta capturar todo lo que necesitas para crear un portafolio espectacular, ¡tan bueno que no pueden ignorarte!

¿Por qué debería crear una cartera?

Para alguien que ha recibido una maestría o un doctorado. de una universidad de primer nivel, conseguir un trabajo podría no ser tan difícil. El instituto agrega credibilidad a su perfil que buscan los empleadores.

Para alguien que no tiene un título relevante o la experiencia suficiente, esa credibilidad debe establecerse a través de una cartera estelar que muestre su potencial. Luego, el portafolio funciona como evidencia de sus competencias.

Existen numerosos factores que pueden aumentar sus posibilidades de ser notado por un empleador. Con una estrategia inteligente y esfuerzos constantes, podrá resolverlo.

¡Construyamos un plan infalible aquí mismo para trabajar para conseguir un trabajo!

Paso 1 - Identifícate

Saltar de un portal de carreras a otro y postularse para cualquier trabajo que mencione "Datos" no es un movimiento inteligente. Se sumaría a su estrés y carga de trabajo solo para saber que lo han rechazado.

Limite su búsqueda

Imagen para publicación

El espectro de la ciencia de datos en sí mismo es enorme. La mayoría de las personas se encuentran en uno de los estratos de la pirámide que se muestran en el diagrama. Solo unos pocos pueden dominar dos o tres de las capas.

Una organización basada en datos emplea hoy para varios puestos, y aquí hay una lista con el nivel de dificultad de los problemas que resuelven estos profesionales:

  • Analistas de datos : fácil a mediano
  • Ingenieros de datos : medio a difícil
  • Ingenieros de AA - Medio
  • Investigadores / científicos de datos - Difícil
  • Ingenieros de IA / practicantes de aprendizaje profundo : muy difícil

Obviamente, ninguna persona puede realizar todas las tareas. Lo primero que debe hacer es identificar las habilidades que ha dominado (o quiere dominar). Con base en ese conjunto de habilidades, debe seleccionar la descripción del trabajo al que apuntará.

Paso 2: estudiar la descripción del trabajo

Si pasa suficiente tiempo revisando un montón de descripciones de puestos de varios perfiles de datos, notará que solicitan la experiencia incluso si es para alguien recién salido de la universidad.

La segunda cosa que debe comprender es que hay trabajos que tienen requisitos más generalistas como el análisis de datos. Y luego hay áreas de investigación más enfocadas y dedicadas, como un científico investigador en un fondo de cobertura, que es muy matemático.

Aquí hay algunas capturas de pantalla que he capturado de algunas organizaciones grandes (Facebook, NetFlix) y medianas (h20.ai) que buscan en un candidato:

Imagen para publicación

Estudiarlos nos lleva de regreso a la pregunta muy importante y común:

¿Cómo puedo compensar el factor experiencia si acabo de salir de la escuela ?

¡La respuesta son proyectos!

¡Espere! Ya sabia eso…

Esto es lo que probablemente no sabía: estos proyectos no pueden ser su análisis sobre el conjunto de datos MNIST o la solución del problema de clasificación del conjunto de datos del Titanic.

Entonces, ¿qué tipo de proyectos? ¿Dónde obtengo estos proyectos? ¿Qué debo hacer?

Para responder a eso, profundicemos en la construcción de su cartera.

Paso 3: mostrar experiencia a través de proyectos

Los proyectos son su único sustituto de la experiencia.

Chris Albon, cuando se le preguntó sobre lo que las personas deberían tener en su portafolio cuando buscan su primer trabajo en una entrevista con Datacamp, dijo:

... cuando alguien se postula, algunas de las mejores cosas con las que pueden postularse son proyectos que han hecho o algo como, digamos, un campo de entrenamiento o tal vez su investigación de tesis o algo así, donde podemos echar un vistazo y decir, oh, genial, como si hubieras hecho algunas cosas interesantes, has trabajado con algunos datos, de algunas formas interesantes.

¿Qué deberían reflejar estos proyectos?

Hay cuatro factores principales que sus proyectos deben validar, independientemente del perfil que solicite:

  1. Su firme control sobre las competencias requeridas
  2. La complejidad del problema que ha resuelto o estudiado: puede ser un problema nuevo o un problema de nivel empresarial comúnmente solicitado.
  3. Experiencia en el dominio : la cantidad de investigación que realizó para encontrar las respuestas a las preguntas o construir una infraestructura de datos.
  4. Su voluntad de hacer un esfuerzo adicional y hacer que el proyecto se destaque: implementar su proyecto para uso público o escribir un blog o publicar un video para explicar sus hallazgos.

Tipos de proyectos para agregar a su cartera

Teniendo en cuenta los factores mencionados anteriormente, aquí hay una lista de ideas de proyectos que requerirán esfuerzos sinceros, pero que agregarán peso a su cartera.

  • Trabajar con datos reales: si puede mostrarle a alguien que puede trabajar con datos sin procesar de diferentes fuentes y responder preguntas interesantes sobre leyes sociales, finanzas, atención médica o cualquier experimento científico, sería muy apreciado.
  • Explorar p conjuntos de datos disponibles ublicly:
Imagen para publicación

Haciendo uso de conjuntos de datos disponibles públicamente, explore los datos para obtener varios conocimientos, defina preguntas que nunca se han hecho antes, profundice en revistas y artículos de investigación para buscar material relacionado y luego descubra patrones ocultos utilizando modelos estadísticos.

Un análisis en profundidad de un conjunto de datos disponible públicamente es nuevamente un buen lugar para comenzar.

  • Explote su curiosidad: como profesional de datos curioso, debe haber productos / servicios / preguntas que le parezcan intrigantes. Utilice esta curiosidad para investigar nuevos problemas. Por ejemplo, un fanático de los deportes puede construir un tablero o una infraestructura de datos que administre las estadísticas y los patrones de rendimiento de todos los jugadores.
  • Contribución a los paquetes de código abierto : todas las organizaciones tienen en alta estima las contribuciones de código abierto al aprendizaje automático o los paquetes de computación científica. Desarrollar software gratuito y de código abierto mejora en gran medida sus posibilidades de ser reclutado. Puede intentar contribuir a paquetes como sklearn, numpy y pandas. Demuestra que puede trabajar con bases de código enormes y complejas y que conoce bien su material.
  • Creación de proyectos de principio a fin: una excelente manera de demostrar que eres realmente un generalista es crear proyectos de principio a fin (más como productos). No se detenga en encontrar la solución o crear un prototipo para un sistema de recomendaciones o un chatbot fintech. Haga un esfuerzo adicional, impleméntelo, compártalo con sus compañeros para usarlo, recopile algunos análisis. Esto demuestra lo apasionado que está por lo que hace y hasta qué punto puede llegar a aprender nuevas tecnologías y métodos.
  • Proyectos específicos de habilidades: hay personas que son realmente buenas limpiando datos o creando gráficos detallados o automatizando canalizaciones de datos. Debería considerar desarrollar sus propios paquetes de Python que podrían automatizar esas tareas de limpieza o, dado un marco de datos, el paquete debería crear parcelas de pares y todas las demás posibilidades para acelerar el proceso de EDA.

Lista de algunas carteras realmente interesantes para inspirarse:

  • //nycdatascience.com/blog/student-works/improving-a-music-websites-user-experience/
  • //varianceexplained.org/r/trump-tweets/
  • //nycdatascience.com/blog/student-works/forecasting-cryptocurrencies-price-trends/
  • //nycdatascience.com/blog/student-works/web-scraping/covid19s-impact-on-preventable-cancer-risk-in-women-a-call-for-action/

Cronograma del proyecto

La cantidad de tiempo que dedica a un proyecto da pistas sobre la complejidad, el nicho y el volumen de trabajo que requiere. Debería ayudarlo a justificar si el proyecto es digno de una cartera o no.

El esfuerzo que pongas en tu proyecto para llevarlo al siguiente nivel depende de muchos factores diferentes.

Solo para darle algo para cuantificar, si ha elegido una tecnología incipiente con la que trabajar, debe dedicar al menos un mes a construir algo concreto.

Cómo agregar estos proyectos a su cartera

Una vez que tenga algunos buenos proyectos que pueda incluir en su portafolio, el siguiente paso es empaquetar su trabajo de la mejor manera posible.

Apple es conocida por su empaque y diseño. Sea sincero acerca de cómo empaqueta su trabajo antes de mostrarlo.

Así es como puede agregar más peso a sus proyectos:

  • GitHub URL: Si decide agregar un enlace a su cesión temporal, asegúrese de que acaba de recompra no contiene un cuaderno Jupyter, debe tener todos los otros archivos comorequirements.txt,.gitignoreuna licencia, si es necesario, y así sucesivamente. De esa manera, será contratado como un paquete completo y no solo como un experto en portátiles de Jupyter.
  • Blogs: escribir sobre lo que ha logrado siempre es una buena práctica y, para los empleadores, genera confianza en su trabajo y su capacidad para comunicar de manera eficaz lo que ha hecho.
  • Aplicaciones implementadas: si ha implementado su aplicación impulsada por ML, proporcione el enlace para que el empleador juegue con ella.
  • Paneles: Si está orgulloso de su análisis, puede crear un panel a partir de él. Puede usar Voila o Dash si está trabajando en Python. Si es un experto en análisis de negocios, puede agregar su Power BI o Tableautablero amuestre sus habilidades analíticas.

Paso 4 - Perfiles de redes sociales

Un buen perfil en las redes sociales puede ayudarte a conseguir el próximo trabajo de tus sueños. GitHub, LinkedIn, Twitter, Kaggle, StackOverflow y Medium son las principales plataformas que las personas utilizan para compartir su trabajo / sentimientos, establecer contactos, consumir información y publicitar.

Las organizaciones y los reclutadores utilizan estas plataformas para llegar a su próxima contratación potencial.

  • GitHub: Tener un buen perfil de GitHub con muchas contribuciones o estrellas en tus repositorios te convierte en un programador competitivo.
Imagen para publicación
  • Kaggle: participar en las competiciones de Kaggle, crear cuadernos y conjuntos de datos útiles también puede ayudarlo a crear un buen perfil de analista de datos.
Imagen para publicación

Un extracto de la publicación de Reshama Shaikh To Kaggle or Not dice:

Es cierto, hacer una competencia de Kaggle no califica a alguien para ser un científico de datos. Tampoco lo es tomar una clase o asistir a un tutorial de conferencia o analizar un conjunto de datos o leer un libro en ciencia de datos. Trabajar en la (s) competencia (s) aumenta su experiencia y aumenta su cartera. Es un complemento para sus otros proyectos, no la única prueba de fuego del conjunto de habilidades de ciencia de datos de uno.
  • LinkedIn: He utilizado LinkedIn personalmente para conseguir mi primer trabajo, mi primer cliente y muchos colaboradores. Es una plataforma única para conectarse con personas que trabajan en las empresas de sus sueños, interactuar con ellas, encontrar trabajos y seguir avances interesantes. Lea esta guía completa de perfiles de LinkedIn de ciencia de datos para optimizar su perfil.

    Consejo: debe estar listo para ofrecer algo antes de pedir un favor.

  • Twitter: Todos los grandes nombres en el espacio de la ciencia de datos usan Twitter con bastante frecuencia y puedes interactuar con personas de tu campo. Aprenderá en qué están trabajando estas personas y sus sentimientos sobre los problemas sociales.

    Puede promocionar sus blogs, videos y otros hallazgos con su Twitter. Las personas tienen ofertas de trabajo, invitaciones a conferencias, trabajo independiente y contratos de marketing de influencers por su trabajo y buenos seguidores en Twitter.

Principales científicos de datos a seguir en Twitter:

  • Andreas Mueller - Desarrollador de aprendizaje de Sci-kit
  • Yann LeCunn - Científico jefe de inteligencia artificial en Facebook
  • Dean Abbott - Científico jefe de datos SmarterHQ
  • Andrew Ng, cofundador de Coursera

Hay muchos otros, puedes mirar mi perfil y las personas que sigo en mi perfil de Twitter.

Paso 5: condensar una cartera en un currículum de una sola página

El elemento más importante de su solicitud de empleo es su currículum, ya que decide si será preseleccionado para el trabajo o no.

Teniendo en cuenta que tiene todos los demás elementos en buena forma, es hora de condensar esa información en un currículum elegante y conciso.

Como debe saber, los reclutadores no dedican más de un par de minutos a hojear su currículum, por lo que debe transmitir todo lo que ha hecho en una sola página.

Las secciones más importantes después de su nombre e información de contacto:

  1. Resumen : En 1 o 2 oraciones, transmita lo que ha estado haciendo y lo que pretende hacer.
  2. Habilidades : no las llene con todas las habilidades aleatorias que le vienen a la mente. No se marque en una escala. Una sola línea con todas las competencias principales debería ser suficiente.
  3. Proyectos : esta debería ser la sección principal para los nuevos graduados, ya que no tiene mucho en su sección de experiencia. Sea conciso sobre lo que ha logrado, agregue hipervínculos a su trabajo. Consiga proyectos culminantes, concursos de Kaggle, investigaciones independientes y proyectos. Esta sección se llamará su carpeta de trabajos.
  4. Trabajo del curso : agregue solo el trabajo del curso relevante. Puede mencionar su GPA si corresponde.
  5. Experiencia (si tiene alguna): agregue el historial laboral relevante junto con las viñetas que hablan de las principales tareas que realizó en la organización.
  6. Enlaces a redes sociales : no olvide agregar enlaces a sus perfiles activos en redes sociales.

Aquí hay un ejemplo de un buen currículum que se revisó durante Kaggle CareerCon2018:

Imagen para publicación

Llamada a la acción

Probablemente todavía tengas muchas preguntas. ¿Dónde debería buscar ideas para proyectos? ¿Cómo empiezas? ¿Cómo te preparas para las entrevistas? Y muchos más.

He estado trabajando en la creación de proyectos para cada perfil basado en mi experiencia trabajando como diseñador instruccional para pistas de ciencia de datos y web.

Según su respuesta a esta publicación, crearé un canal de Discord para cada perfil donde compartiré los proyectos y las instrucciones para completarlos con la línea de tiempo asociada a cada uno.

Creo firmemente en la pedagogía basada en proyectos y, por lo tanto, crearé una gran cantidad de contenido donde se cubriría el desarrollo de proyectos. Estaría compartiendo los recursos que puede usar para aprender (algunos de los cuales crearé yo mismo) y completar los proyectos con éxito.

Puede ver uno de mis ejemplos aquí: Panel de análisis interactivo COVID-19 de Jupyter Notebooks.

Aquí está la versión en video de esta publicación de blog en mi canal Data Science with Harshit:

Ciencia de datos con Harshit

Con este canal, planeo lanzar un par de series que cubran todo el espacio de la ciencia de datos. He aquí por qué debería suscribirse al canal:

  • Esta serie cubriría todos los tutoriales de calidad requeridos / exigidos sobre cada uno de los temas y subtemas, como los fundamentos de Python para la ciencia de datos.
  • Matemáticas explicadas y derivaciones de por qué hacemos lo que hacemos en ML y Deep Learning.
  • Podcasts con científicos e ingenieros de datos de Google, Microsoft, Amazon, etc., y directores ejecutivos de empresas impulsadas por big data.
  • Proyectos e instrucciones para implementar los temas aprendidos hasta el momento.

Para llevar adelante la discusión, no dude en conectarse conmigo en LinkedIn o Twitter.