La paradoja de Moravec en cualquier industria

Alfonso RuizAlfonso Ruiz
16/4/2024
AUTOR
Colegio de matemáticas Bourbaki

Alfonso Ruiz

El poderoso empuje de los Grandes Modelos del Lenguaje (LLM) a las aplicaciones de la Inteligencia Artificial en distintos ámbitos de una compañía nos han hecho creer erróneamente que los modelos matemáticos son lo suficientemente robustos como para sustituir a los seres humanos en la mayor parte de las tareas adentro de una compañía.

Sin embargo todos los que tratamos con los modelos de Machine Learning que aprenden de un conjunto de datos sabemos que tienen desventajas obvias sobre los seres humanos; seguramente algunas de ellas son imposibles de solucionar a menos que se introduzca una idea completamente nueva en su desarrollo. Dicho esto no queda claro si existe alguna familia de tareas que sean imposibles para estos modelos.

En este artículo de nuestro boletín hablaremos sobre la famosa paradoja de Moravec que contrapone las tareas intelectualmente complicadas con las tareas en las que los la percepción de nuestros sentidos tienen una gigantesca ventaja sobre cualquier modelo matemático.

¿Qué dice la paradoja de Moravec?

El matemático Hans Moravec observó que paradójicamente las tareas en las que la inteligencia artificial tiene más problemas para funcionar adecuadamente son aquellas que tradicionalmente asociaríamos a un bajo nivel de inteligencia mientras que donde funciona mejor es en las tareas más complejas intelectualmente hablando.

Sus principales observaciones provienen de la robótica en donde por un lado fácilmente podríamos entrenar un modelo matemático que venza en ajedrez a cualquier jugador profesional, sin embargo construir un robot que pueda vencer a un jugador amateur en Tenis de Mesa es prácticamente imposible en la actualidad.

Moravec va un poco más lejos señalando que inclusive tareas físicas que pueden realizar los bebés con mucho éxito, son verdaderamente complicadas para una inteligencia artificial. Uno de sus señalamientos para distinguir esta complejidad se encuentra en la complejidad computacional de los sensores que se necesitan para jugar correctamente un deporte como el tenis de mesa.

Un profesor de Matemáticas

Supongamos que un profesor en el Colegio de Matemáticas Bourbaki desea enseñarle a sus alumnos cómo se multiplican dos matrices y la teoría matemática detrás de esta operación.

Quienes hayan tenido la oportunidad de utilizar ya sea GPT-4 o Gemini en sus versiones multimodales, es decir las que reciben tanto textos como imágenes están de acuerdo con que todas estas de los alumnos podrían resolverse satisfactoriamente (en la mayoría de los casos). Invitamos a los estudiantes a poner a prueba a alguno de estos modelos.

  • ¿Qué tamaño deben de tener las matrices para poderse multiplicar?
  • ¿Qué representa geométricamente la multiplicación de una matriz diagonal?
  • Mencione una familia de matrices cuya multiplicación sea conmutativa.

Inclusive si le permitimos al estudiante enviarnos una imagen podríamos contestar con mucho éxito las siguientes preguntas:

  • La imagen de dos matrices multiplicándose + la pregunta ¿cuál es el resultado de esta multiplicación?
  • La imagen de dos matrices multiplicándose y un error en alguna de las entradas de la multiplicación + la pregunta ¿dónde está el error en esta multiplicación de matrices?

Todas las tareas anteriores parecen bastante complicadas si el profesor no tuviera algún conocimiento de matemáticas sin embargo a nadie nos sorprendería que alguno de estos LLM sea capaz de solucionar el problema. Sin lugar a dudas están en una escala superior que el problema de multiplicar dos matrices el cual cualquier computadora lo puede hacer.

Por el contrario, no conozco un robot que pueda en un pizarrón, si le escribo dos matrices cualesquiera que se puedan multiplicar, escribir la multiplicación de esas dos matrices. Sé que compañías como Figure se han aliado con OpenAI en el desarrollo de robots que puedan implementar sus LLM sin embargo la paradoja de Moravec diría que es un problema mucho más complicado.

¿Es cierta la paradoja de Moravec?

Hace algunas semanas estuve estudiando un artículo en donde un equipo conjunto entre el Korea Advanced Institute of Science and Technology y Kolon Industries, Inc desarrollan una solución vía inteligencia artificial para el acomodo de productos de moda en un retail.

Su afirmación es que por medio de técnicas de procesamiento de imágenes con redes neuronales profundas sumado a un proceso de optimización, es posible lograr resultados tan buenos como los de los practicantes. El artículo se titulta Breaking Moravec’s Paradox: Visual-Based Distribution in Smart Fashion Retail y se los recomiendo ampliamente.

¿Dónde aprender más?