Everything You Always Wanted to Know About Deep Learning* (*But Were Afraid to Ask)

14/10/2022
AUTOR
Colegio de matemáticas Bourbaki

Sabemos que las Redes Neuronales Profundas es un tema candente que interesa cada vez más tanto a la Industria como a la Academia y por ello les presentamos una cuidadosa elección de 7 preguntas que posiblemente se han hecho sobre estos modelos matemáticos.

Desde nuestro punto de vista Deep Learning como muchas otras técnicas utilizadas para el análisis de los datos, debe considerarse una herramienta más dentro del gran abanico de posibilidades que tienen las empresas para proponer soluciones basadas en datos. Lo anterior no significa que podemos obviar el hecho de que las redes neuronales profundas son quizás la herramienta más poderosa que existe en la actualidad para resolver problemas de Inteligencia Artificial.

No alt text provided for this image

¿Funcionan las redes neuronales?

Existen problemas para los cuáles las redes neuronales no son la solución óptima, supongamos por ejemplo que nuestro objetivo es un análisis descriptivo o incluso uno prescriptivo (en el sentido de interpretabilidad que hablaremos más adelante).

Para fijar ideas supongamos que deseamos comprender las razones por las que una pieza falla en una línea de producción, en este caso la mayor parte de las redes neuronales (aunque no es una regla general) tienden a dificultar el relato de una solución basada en datos.

Por el otro lado existen problemas que involucran fuentes de datos que pueden ser arbitrariamente complicadas como imágenes, texto, audio o incluso combinaciones de las anteriores. Para estos casos las redes neuronales profundas son el state of the art. Inclusive en este tipo de datos podrían aparecer dificultades para utilizar redes neuronales, dos muy comunes son el tamaño del conjunto de datos con el que contamos y el etiquetado de estos.

No alt text provided for this image

¿Qué es la profundidad de una red neuronal?

La profundidad de una red neuronal está ligada a la complejidad del modelo, esto tiene importantes repercusiones tanto desde el punto de vista estadístico como computacional. En general el científico de datos debe elegir cuidadosamente este parámetro y desafortunadamente no existe alguna regla absoluta de permita identificar cuál es la profundidad ideal.

No alt text provided for this image

¿Por qué algunas organizaciones tienen problemas para utilizar redes neuronales profundas?

Supongamos que nuestros datos y el objetivo principal son adecuados para utilizar alguna de las muchas arquitecturas de redes neuronales que existen. Implementar este tipo de modelos podría tener dificultades técnicas ligadas por ejemplo a la capacidad computacional con la que contemos. Es muy importante enfatizar que a pesar de que este es un problema real, no todas las redes neuronales y no para todas las bases de datos el entrenamiento requiere grandes capacidades computacionales.

No alt text provided for this image

¿Las redes neuronales son Machine Learning?

Sí, las redes neuronales al igual que otros modelos matemáticos vienen a nosotros acompañadas de un algoritmo de entrenamiento que permite mejorar la calidad de las predicciones a medida que aumentemos el tamaño y la representatividad de nuestras bases de datos, esta es la promesa de Machine Learning.

¿Qué son los modelos tipo black-box?

Algunas redes neuronales pueden contener hasta billones de parámetros lo cual hace imposible resolver el problema de la explicabilidad de estos modelos. Imaginemos que nuestra red neuronal predice por ejemplo que un cliente incumplirá algún día con un crédito que le otorgue, lo ideal desde el punto de vista de nuestro negocio sería entender cuál es la razón por la cual esto ocurre, desafortunadamente en numerosas ocasiones la inmensidad de estos modelos lo hace imposible.

No alt text provided for this image

¿Los matemáticos entienden cómo funcionan las redes neuronales profundas?

No por completo, a pesar de que las redes neuronales están construidas utilizando fórmulas matemáticas (por ejemplo que utilizan: sumas, multiplicaciones, iteraciones, no-linealidades, etc.), no existen teoremas matemáticos que logren resolver preguntas tan fundamentales como:

  • ¿Cuál red neuronal dará mejores buenos resultados para mi base de datos?
  • ¿Cuántos datos necesito para lograr cierto performance?

Sobre la construcción de las redes neuronales como funciones y algunos aspectos del entrenamiento, les compartimos dos de nuestras infografías tituladas: Las magiamáticas de las redes neuronales.

¿Qué ocurre durante el entrenamiento?

El entrenamiento de una red neuronal utiliza un algoritmo muy inteligente que hace una búsqueda de los parámetros óptimos para reducir el error que comete la red neuronal en nuestra base de datos. Sin este algoritmo la búsqueda de los parámetros adecuados una red neuronal profunda podría tardar tanto tiempo como la existencia de nuestro sistema solar.

No alt text provided for this image

¿Dónde aprender más?

Si está interesados en conocer más sobre las redes neuronales profundas y sus aplicaciones en la industria, el Colegio de Matemáticas Bourbaki ofrece dos cursos que podrían ser de su interés: