¿Quieres saber cómo funciona el aprendizaje profundo? Aquí hay una guía rápida para todos.

La inteligencia artificial (IA) y el aprendizaje automático (ML) son algunos de los temas más candentes en este momento.

El término "IA" se usa casualmente todos los días. Escuchas a los aspirantes a desarrolladores decir que quieren aprender IA. También escucha a los ejecutivos decir que quieren implementar IA en sus servicios. Pero, con bastante frecuencia, muchas de estas personas no comprenden qué es la IA.

Una vez que haya leído este artículo, comprenderá los conceptos básicos de IA y ML. Más importante aún, comprenderá cómo funciona el aprendizaje profundo, el tipo más popular de aprendizaje automático.

Esta guía está dirigida a todos, por lo que no se involucrarán matemáticas avanzadas.

Antecedentes

El primer paso para comprender cómo funciona el aprendizaje profundo es comprender las diferencias entre términos importantes.

Inteligencia artificial vs aprendizaje automático

La inteligencia artificial es la replicación de la inteligencia humana en computadoras.

Cuando comenzó la investigación de la IA, los investigadores intentaban replicar la inteligencia humana para tareas específicas, como jugar un juego.

Introdujeron una gran cantidad de reglas que la computadora debía respetar. La computadora tenía una lista específica de posibles acciones y tomaba decisiones basadas en esas reglas.

El aprendizaje automático se refiere a la capacidad de una máquina para aprender utilizando grandes conjuntos de datos en lugar de reglas codificadas.

ML permite que las computadoras aprendan por sí mismas. Este tipo de aprendizaje aprovecha la potencia de procesamiento de las computadoras modernas, que pueden procesar fácilmente grandes conjuntos de datos.

Aprendizaje supervisado vs aprendizaje no supervisado

El aprendizaje supervisado implica el uso de conjuntos de datos etiquetados que tienen entradas y salidas esperadas.

Cuando entrenas a una IA usando el aprendizaje supervisado, le das una entrada y le dices el resultado esperado.

Si la salida generada por la IA es incorrecta, reajustará sus cálculos. Este proceso se realiza de forma iterativa sobre el conjunto de datos, hasta que la IA no cometa más errores.

Un ejemplo de aprendizaje supervisado es una IA que predice el clima. Aprende a predecir el clima utilizando datos históricos. Los datos de entrenamiento tienen entradas (presión, humedad, velocidad del viento) y salidas (temperatura).

El aprendizaje no supervisado es la tarea del aprendizaje automático que utiliza conjuntos de datos sin una estructura especificada.

Cuando entrena a una IA usando el aprendizaje no supervisado, deja que la IA haga clasificaciones lógicas de los datos.

Un ejemplo de aprendizaje no supervisado es una IA que predice el comportamiento para un sitio web de comercio electrónico. No aprenderá usando un conjunto de datos etiquetados de entradas y salidas.

En cambio, creará su propia clasificación de los datos de entrada. Le dirá qué tipo de usuarios es más probable que compren diferentes productos.

Ahora bien, ¿cómo funciona el aprendizaje profundo?

Ahora está preparado para comprender qué es el aprendizaje profundo y cómo funciona.

Deep Learning es un método de aprendizaje automático . Nos permite entrenar una IA para predecir salidas, dado un conjunto de entradas. Tanto el aprendizaje supervisado como el no supervisado se pueden utilizar para entrenar la IA.

Aprenderemos cómo funciona el aprendizaje profundo mediante la construcción de un servicio hipotético de estimación de precios de boletos de avión . Lo formaremos utilizando un método de aprendizaje supervisado.

Queremos que nuestro estimador de precios de boletos de avión prediga el precio usando las siguientes entradas (estamos excluyendo los boletos de regreso por simplicidad):

  • Aeropuerto de origen
  • Aeropuerto de destino
  • Fecha de salida
  • Aerolínea

Redes neuronales

Echemos un vistazo al interior del cerebro de nuestra IA.

Como los animales, el cerebro de nuestro estimador AI tiene neuronas. Están representados por círculos. Estas neuronas están interconectadas.

Las neuronas se agrupan en tres tipos diferentes de capas:

  1. Capa de entrada
  2. Capa (s) oculta (s)
  3. Capa de salida

La capa de entrada recibe datos de entrada. En nuestro caso, tenemos cuatro neuronas en la capa de entrada: Aeropuerto de origen, Aeropuerto de destino, Fecha de salida y Aerolínea. La capa de entrada pasa las entradas a la primera capa oculta.

Las capas ocultas realizan cálculos matemáticos en nuestras entradas. Uno de los desafíos en la creación de redes neuronales es decidir la cantidad de capas ocultas, así como la cantidad de neuronas para cada capa.

Lo " profundo " en Deep Learning se refiere a tener más de una capa oculta.

La capa de salida devuelve los datos de salida. En nuestro caso, nos da la predicción del precio.

Entonces, ¿cómo calcula la predicción de precios?

Aquí es donde comienza la magia del Deep Learning .

Cada conexión entre neuronas está asociada con un peso . Este peso dicta la importancia del valor de entrada. Los pesos iniciales se establecen de forma aleatoria.

Al predecir el precio de un boleto de avión, la fecha de salida es uno de los factores más importantes. Por tanto, las conexiones neuronales de la fecha de salida tendrán un gran peso.

Cada neurona tiene una función de activación. Estas funciones son difíciles de entender sin un razonamiento matemático.

En pocas palabras, uno de sus propósitos es "estandarizar" la salida de la neurona.

Una vez que un conjunto de datos de entrada ha pasado por todas las capas de la red neuronal, devuelve los datos de salida a través de la capa de salida.

Nada complicado, ¿verdad?

Entrenamiento de la red neuronal

Entrenar la IA es la parte más difícil del Deep Learning. ¿Por qué?

  1. Necesita un gran conjunto de datos .
  2. Necesita una gran cantidad de potencia computacional .

Para nuestro estimador de precios de boletos de avión, necesitamos encontrar datos históricos de precios de boletos. Y debido a la gran cantidad de posibles aeropuertos y combinaciones de fechas de salida, necesitamos una lista muy grande de precios de boletos.

Para entrenar la IA, debemos darle las entradas de nuestro conjunto de datos y comparar sus salidas con las salidas del conjunto de datos. Dado que la IA aún no está entrenada, sus resultados serán incorrectos.

Una vez que revisamos todo el conjunto de datos, podemos crear una función que nos muestre qué tan equivocadas estaban las salidas de la IA respecto a las salidas reales. Esta función se denomina función de coste.

Idealmente, queremos que nuestra función de costo sea cero. Ahí es cuando las salidas de nuestra IA son las mismas que las salidas del conjunto de datos.

¿Cómo podemos reducir la función de costes?

Cambiamos los pesos entre neuronas. Podríamos cambiarlos aleatoriamente hasta que nuestra función de costo sea baja, pero eso no es muy eficiente.

En su lugar, usaremos una técnica llamada Gradient Descent.

Gradient Descent es una técnica que nos permite encontrar el mínimo de una función. En nuestro caso, buscamos el mínimo de la función de costo.

Funciona cambiando los pesos en pequeños incrementos después de cada iteración del conjunto de datos . Al calcular la derivada (o gradiente) de la función de costo en un cierto conjunto de pesos, podemos ver en qué dirección está el mínimo.

Para minimizar la función de costo, necesita iterar a través de su conjunto de datos muchas veces. Es por eso que necesita una gran cantidad de potencia computacional.

La actualización de los pesos mediante descenso de gradiente se realiza automáticamente . ¡Esa es la magia del aprendizaje profundo!

Una vez que hayamos entrenado nuestro estimador de precios de boletos de avión AI, podemos usarlo para predecir precios futuros.

¿Dónde puedo aprender más?

Hay muchos otros tipos de redes neuronales: redes neuronales convolucionales para visión por computadora y redes neuronales recurrentes para procesamiento del lenguaje natural.

Si desea aprender el aspecto técnico del Deep Learning, le sugiero que tome un curso en línea.

Actualmente, uno de los mejores cursos de Deep Learning es la especialización en Deep Learning de Andrew Ng. Si no está interesado en obtener un certificado, no necesita pagar por el curso. En su lugar, puede auditarlo de forma gratuita.

Si tiene alguna pregunta o desea más explicaciones técnicas de los conceptos, ¡pregunte a continuación!

En resumen…

  • El aprendizaje profundo utiliza una red neuronal para imitar la inteligencia animal.
  • Hay tres tipos de capas de neuronas en una red neuronal: la entradaCapa, la (s) capa (s) oculta (s) y la capa de salida.
  • Las conexiones entre neuronas están asociadas con un peso, lo que dicta la importancia del valor de entrada.
  • Las neuronas aplican una función de activación en los datos para "estandarizar" la salida que sale de la neurona.
  • Para entrenar una red neuronal, necesita un gran conjunto de datos.
  • La iteración a través del conjunto de datos y la comparación de las salidas producirá una función de costo, que indica cuánto está la IA fuera de las salidas reales.
  • Después de cada iteración a través del conjunto de datos, los pesos entre las neuronas se ajustan usando Gradient Descent para reducir la función de costo.

Si te ha gustado este artículo, dame algunas palmadas para que más personas lo vean. ¡Gracias!

¡También puedes ver mi experiencia de cómo obtuve mi pasantía en Shopify!

Para obtener más actualizaciones, sígueme en Twitter.