Cómo empezar a utilizar Python para el aprendizaje profundo y la ciencia de datos

Una guía paso a paso para configurar Python para un principiante completo

Puede codificar su propio proyecto de ciencia de datos o aprendizaje profundo en solo un par de líneas de código en estos días. Esto no es una exageración; Muchos programadores han hecho el trabajo duro de escribir toneladas de código para que lo usemos, de modo que todo lo que tenemos que hacer es conectar y usar en lugar de escribir código desde cero.

Es posible que haya visto parte de este código en publicaciones de blog de ciencia de datos / aprendizaje profundo. Quizás hayas pensado: "Bueno, si es realmente tan fácil, ¿por qué no lo intento yo mismo?"

Si eres un principiante en Python y quieres embarcarte en este viaje, esta publicación te guiará a través de tus primeros pasos. Una queja común que escucho de los principiantes es que es bastante difícil configurar Python. ¿Cómo hacemos que todo comience en primer lugar para que podamos conectar y usar el código de ciencia de datos o aprendizaje profundo?

Esta publicación lo guiará paso a paso a través de cómo configurar Python para sus proyectos de ciencia de datos y aprendizaje profundo. Lo haremos:

  • Configurar Anaconda y Jupyter Notebook
  • Cree entornos Anaconda e instale paquetes (código que otros han escrito para hacernos la vida tremendamente fácil) como tensorflow, keras, pandas, scikit-learn y matplotlib.

Una vez que haya configurado lo anterior, puede construir su primera red neuronal para predecir los precios de la vivienda en este tutorial aquí:

Construya su primera red neuronal para predecir los precios de la vivienda con Keras

Configuración de Anaconda y Jupyter Notebook

El principal lenguaje de programación que vamos a utilizar se llama Python, que es el lenguaje de programación más utilizado por los practicantes de Deep Learning.

El primer paso es descargar Anaconda, que puede considerar como una plataforma para usar Python "lista para usar".

Visite esta página: //www.anaconda.com/distribution/ y desplácese hacia abajo para ver esto:

Este tutorial está escrito específicamente para usuarios de Windows, pero las instrucciones para usuarios de otros sistemas operativos no son tan diferentes. Asegúrese de hacer clic en "Windows" como su sistema operativo (o cualquier sistema operativo en el que se encuentre) para asegurarse de que está descargando la versión correcta.

Este tutorial usará Python 3, así que haga clic en el botón verde Descargar debajo de "Python 3.7 versión". Debería aparecer una ventana emergente para que haga clic en "Guardar" en el directorio que desee.

Una vez que haya terminado de descargarse, siga la configuración paso a paso de la siguiente manera:

Una vez realizada la instalación, vaya a su menú Inicio y debería ver algún software recién instalado:

Haga clic en Anaconda Navigator, que es un centro integral para navegar por las aplicaciones que necesitamos. Debería ver una portada como esta:

Haga clic en 'Iniciar' debajo de Jupyter Notebook, que es el segundo panel de mi pantalla de arriba. Jupyter Notebook nos permite ejecutar código Python de forma interactiva en el navegador web, y es donde escribiremos la mayor parte de nuestro código.

Debería abrirse una ventana del navegador con la lista de su directorio. Voy a crear una carpeta en mi escritorio llamada “Tutorial intuitivo de aprendizaje profundo”. Si navega a la carpeta, su navegador debería verse así:

En la parte superior derecha, haga clic en Nuevo y seleccione "Python 3":

Debería aparecer una nueva ventana del navegador como esta.

Felicitaciones, ha creado su primer cuaderno de Jupyter. Ahora es el momento de escribir código. Los cuadernos de Jupyter nos permiten escribir fragmentos de código y luego ejecutar esos fragmentos sin ejecutar el programa completo. Esto quizás nos ayude a ver cualquier resultado intermedio de nuestro programa.

Para comenzar, escribamos un código que mostrará algunas palabras cuando lo ejecutemos. Esta función se llama imprimir . Copie y pegue el siguiente código en el cuadro gris de su cuaderno Jupyter:

print("Hello World!")

Su cuaderno debería verse así:

Ahora, presione Alt-Enter en su teclado para ejecutar ese fragmento de código:

Puede ver que el cuaderno de Jupyter muestra las palabras "¡Hola, mundo!" en el panel de visualización debajo del fragmento de código. El número 1 también ha llenado los corchetes, lo que significa que este es el primer fragmento de código que hemos ejecutado hasta ahora. Esto nos ayudará a rastrear el orden en el que hemos ejecutado nuestros fragmentos de código.

En lugar de Alt-Enter, tenga en cuenta que también puede hacer clic en Ejecutar cuando el fragmento de código esté resaltado:

Si desea crear nuevos bloques grises para escribir más fragmentos de código, puede hacerlo en Insertar.

Jupyter Notebook también le permite escribir texto normal en lugar de código. Haga clic en el menú desplegable que actualmente dice "Código" y seleccione "Markdown":

Ahora, nuestro cuadro gris que está etiquetado como rebajado no tendrá corchetes al lado. Si escribe algo de texto en este cuadro gris ahora y presiona Alt-Enter, el texto lo representará como texto sin formato como este:

Hay algunas otras características que puede explorar. ¡Pero ahora tenemos el cuaderno Jupyter configurado para que comencemos a escribir código!

Configurando el entorno Anaconda e instalando paquetes

Ahora tenemos nuestra plataforma de codificación configurada. Pero, ¿vamos a escribir código de Deep Learning desde cero? ¡Eso parece algo extremadamente difícil de hacer!

¡La buena noticia es que muchos otros han escrito código y lo han puesto a nuestra disposición! Con la contribución del código de otros, podemos jugar con los modelos de Deep Learning a un nivel muy alto sin tener que preocuparnos por implementarlo todo desde cero. Esto hace que sea extremadamente fácil para nosotros comenzar a codificar modelos de Deep Learning.

Para este tutorial, descargaremos cinco paquetes que los practicantes de Deep Learning usan comúnmente:

  • Tensorflow
  • Keras
  • Pandas
  • Scikit-aprender
  • Matplotlib

Lo primero que haremos será crear un entorno Python. Un entorno es como una copia de trabajo aislada de Python, por lo que cualquier cosa que haga en su entorno (como instalar nuevos paquetes) no afectará a otros entornos. Es una buena práctica crear un entorno para sus proyectos.

Haga clic en Entornos en el panel izquierdo y debería ver una pantalla como esta:

Haga clic en el botón "Crear" en la parte inferior de la lista. Debería aparecer una ventana emergente como esta:

Nombre su entorno y seleccione Python 3.7 y luego haga clic en Crear. Esto podría tomar un momento.

Una vez hecho esto, su pantalla debería verse así:

Observe que hemos creado un entorno de 'aprendizaje profundo intuitivo'. Podemos ver qué paquetes tenemos instalados en este entorno y sus respectivas versiones.

¡Ahora instalemos algunos paquetes que necesitamos en nuestro entorno!

Los dos primeros paquetes que instalaremos se denominan Tensorflow y Keras, que nos ayudan al código plug-and-play para Deep Learning.

En Anaconda Navigator, haga clic en el menú desplegable donde actualmente dice "Instalado" y seleccione "No instalado":

Una lista completa de paquetes que no ha instalado aparecerá así:

Busque "tensorflow" y haga clic en la casilla de verificación para "keras" y "tensorflow". Luego, haga clic en "Aplicar" en la parte inferior derecha de su pantalla:

Una ventana emergente debería aparecer así:

Haga clic en Aplicar y espere unos momentos. Una vez hecho esto, tendremos Keras y Tensorflow instalados en nuestro entorno.

Usando el mismo método, instalemos los paquetes 'pandas', 'scikit-learn' y 'matplotlib'. Estos son paquetes comunes que los científicos de datos usan para procesar los datos, así como para visualizar gráficos agradables en el cuaderno Jupyter.

Esto es lo que debería ver en su Anaconda Navigator para cada uno de los paquetes.

Pandas:

Aprender Scikit:

Matplotlib:

Una vez hecho esto, regrese a "Inicio" en el panel izquierdo de Anaconda Navigator. Debería ver una pantalla como esta, donde dice "Aplicaciones sobre aprendizaje profundo intuitivo" en la parte superior:

Ahora, tenemos que instalar el portátil Jupyter en este entorno. Así que haga clic en el botón verde "Instalar" debajo del logotipo de la computadora portátil Jupyter. Tardará unos minutos (de nuevo). Una vez que haya terminado de instalar, el panel de la computadora portátil Jupyter debería verse así:

Haga clic en Iniciar y se abrirá la aplicación del cuaderno Jupyter.

Cree un cuaderno, escriba estos cinco fragmentos de código y haga clic en Alt-Enter. Este código le dice al notebook que usaremos los cinco paquetes que instaló con Anaconda Navigator anteriormente en el tutorial.

import tensorflow as tf
import keras
import pandas
import sklearn
import matplotlib

Si no hay errores, felicitaciones, tiene todo instalado correctamente:

Ahora que tenemos todo configurado, comenzaremos a construir nuestra primera red neuronal aquí:

Construya su primera red neuronal para predecir los precios de la vivienda con Keras

Una guía completa para principiantes paso a paso para construir su primera red neuronal en un par de líneas de código como un Deep… medium.com

Si ha tenido algún problema con alguno de los pasos anteriores, no dude en comentar a continuación y ¡lo ayudaré!

Sobre el Autor:

¡Hola, soy Joseph! Recientemente me gradué de la Universidad de Stanford, donde trabajé con Andrew Ng en el Grupo de Aprendizaje Automático de Stanford. Quiero hacer que los conceptos de Deep Learning sean lo más intuitivos y fácilmente comprensibles posible para todos, lo que ha motivado mi publicación: Intuitive Deep Learning.